Selon  Martin Kohrs, une décision récente de l'Office européen des brevets sur la brevetabilité des réseaux neuronaux a des implications intéressantes pour l'intelligence artificielle et d'autres innovations dérivées de l'informatique.

La décision T 0702/20 par une Chambre de Recours de l'Office Européen des Brevets est intéressante à plus d'un titre. Premièrement, parce qu'elle concerne la brevetabilité de réseaux neuronaux, à la base de nombreuses applications d'intelligence artificielle et donc un sujet très actuel. Deuxièmement, parce qu'elle intervient après la décision G 1/19, qui concernait quant à elle la  brevetabilité de simulations reposant sur des modèles mathématiques, et qui avait été commentée ici.

Le débat va porter sur :

  • la nature et le caractère technique d'un réseau de neurones de manière générale,
  • l'effet technique des différences avec l'état de l'art sur le fonctionnement d'un ordinateur utilisé pour la mise en Suvre.

Brevetabilité des réseaux neuronaux : L'invention et les arguments du requérant

L'invention objet du recours  T 0702/20 concerne un dispositif à réseau neuronal hiérarchique. Ce réseau est caractérisé en particulier par des couches de neurones qui ne sont que partiellement couplés ('loose coupling'), et ce avant la phase d'entrainement du réseau. Le couplage partiel est par ailleurs basé sur une matrice de contrôle creuse de code correcteur d'erreur ('sparse parity-check matrix').

Ce sont là les deux principales caractéristiques différenciant la revendication de l'art antérieur. Selon la demande, l'invention permet entre de limiter les ressources de calcul nécessaires lors de la phase d'entrainement du réseau et de prévenir un phénomène dit de 'sur-apprentissage' ('overfitting'), dans lequel un réseau neuronal surdimensionné va apprendre les données d'entraînement à un niveau trop détaillé et avoir du mal à généraliser ensuite.

Le requérant va avancer entre autres les arguments suivants :

  • L'apprentissage machine possède, de manière générale, « une finalité technique » et résout « un problème technique bien défini à l'aide de moyens mathématiques ». Une analogie avec le domaine de la cryptographie est mise en avant – en effet, les procédés cryptographiques ne sont pas considérés comme abstraits, bien qu'ils soient souvent basés essentiellement sur des algorithmes mathématiques, et même si les données en entrée et en sortie du procédé soient abstraites.
  • La revendication porte sur un ordinateur, et donc une implémentation technique spécifique est bien présente. Les caractéristiques nouvelles augmentent les capacités d'apprentissage et l'efficacité du dispositif (des capacités de stockage moindres sont suffisantes) – ce sont là des effets techniques. Une implémentation sur des dispositifs moins performants devient possible. La décision G 1/19 indique notamment qu'une meilleure utilisation du stockage dans un ordinateur peut constituer un effet technique.

Brevetabilité des réseaux neuronaux : La décision de la Chambre de Recours

La Chambre de Recours ne va aller dans le sens du requérant pour aucun des arguments avancés.

  • La Chambre de Recours rappelle tout d'abord la nature et la structure d'un réseau neuronal – un tel réseau est constitué de couches de neurones qui reçoivent chacun des données en entrée et produisent des données en sortie. Selon la Chambre, la structure du réseau détermine la classe de fonctions mathématiques que le réseau peut représenter. En tant que tel, le réseau de neurones n'est donc pas considéré comme possédant un caractère technique.
  • De plus, l'analogie de l'apprentissage machine avec la cryptographie n'est pas jugée valable. En effet, l'apprentissage machine n'est pas liée à une utilisation technique implicite, contrairement à la cryptographie, qui implique une sécurité accrue dans la transmission des données encryptées.
  • La Chambre est d'avis qu'on ne se trouve donc pas dans le cas d'une 'utilisation technique ultérieure implicite' des données en sortie, comme cela pouvait être le cas pour certains des exemples de simulations basées sur des modèles mathématiques décrites dans G1/19.
  • Bien que la revendication ne concerne pas un objet exclu en tant que tel de la brevetabilité dans le cas présent un ordinateur, l'implémentation revendiquée ne requiert, selon la Chambre, aucune adaptation de cet ordinateur. Aucune structure matérielle particulière n'est revendiquée, ou même décrite.
  • Par ailleurs, une réduction de la capacité de stockage nécessaire n'induirait pas en soi d'effet technique : un réseau comprenant par exemple un seul neurone nécessiterait peu de ressources, mais ne pourrait pas non plus apprendre de données complexes.
  • Quant à l'avantage supposé relatif au sur-apprentissage, la Chambre indique qu'il n'est pas décrit de quelle façon il est obtenu. Le sur-apprentissage dépend généralement des caractéristiques des données d'apprentissage – or ces caractéristiques ne sont pas évoquées dans le cadre de la détermination du couplage partiel.

Brevetabilité des réseaux neuronaux : Que peut-on conclure de la décision de la Commission ?

La décision applique strictement les règles existantes et rejette le recours. La nouvelle 'structure' d'un réseau neuronal n'est pas suffisante pour être considérée comme technique – aux yeux de la Chambre, elle n'est qu'un pur algorithme mathématique.

La Chambre n'exclut cependant pas qu'une invention basée sur un réseau neuronal puisse résoudre un problème technique. Elle indique que dans la plupart des cas, cela demanderait à ce que ce réseau soit suffisamment spécifié, en particulier en ce qui concerne les données d'entraînement et les tâches techniques qu'il est censé accomplir.

The content of this article is intended to provide a general guide to the subject matter. Specialist advice should be sought about your specific circumstances.