Loin de la fiction : les réseaux neuronaux optiques révolutionnent l’IA

Illustration Conceptuelle de la Technologie de Calcul Quantique

Des recherches récentes ont fait des progrès significatifs dans le développement de réseaux neuronaux optiques, présentant une alternative durable aux modèles actuellement utilisés qui sont énergivores. En tirant parti de la propagation de la lumière à travers des fibres multimodes et d’un nombre minimal de paramètres programmables, les chercheurs ont atteint une précision comparable à celle des systèmes numériques traditionnels tout en réduisant considérablement les besoins en mémoire et en énergie. Cette approche novatrice ouvre la voie à des solutions matérielles d’intelligence artificielle écoénergétiques et hautement efficaces.

Une architecture novatrice pour les réseaux neuronaux optiques utilise le façonnage des fronts d’ondes pour manipuler précisément le trajet des impulsions ultracourtes à travers des fibres multimodes, permettant ainsi un calcul optique non linéaire.

Les systèmes d’intelligence artificielle d’aujourd’hui reposent sur des milliards de paramètres ajustables pour accomplir des objectifs complexes. Cependant, la grande quantité de ces paramètres entraîne des dépenses importantes. L’entraînement et la mise en œuvre de modèles aussi vastes demandent une mémoire et une puissance de traitement considérables, disponibles uniquement dans d’énormes centres de données et consommant autant d’énergie que les demandes électriques de villes de taille moyenne. En réponse, les chercheurs réévaluent actuellement à la fois l’infrastructure informatique et les algorithmes d’apprentissage automatique pour garantir que l’avancement durable de l’intelligence artificielle se poursuive à son rythme actuel.

L’implémentation optique des architectures de réseaux neuronaux est une voie prometteuse en raison de la faible consommation d’énergie des connexions entre les unités. De nouvelles recherches publiées dans les Advanced Photonics combinent la propagation de la lumière à l’intérieur de fibres multimodes avec un petit nombre de paramètres numériquement programmables et atteignent les mêmes performances dans des tâches de classification d’images que les systèmes entièrement numériques avec plus de 100 fois plus de paramètres programmables.

Ce cadre de calcul rationalise les besoins en mémoire et réduit le recours à des processus numériques énergivores, tout en atteignant le même niveau de précision dans diverses tâches d’apprentissage automatique.

Avancée dans les Calculs Optiques Non Linéaires

Au cœur de ce travail novateur, mené par les professeurs Demetri Psaltis et Christophe Moser de l’EPFL (École polytechnique fédérale de Lausanne), réside le contrôle précis des impulsions ultracourtes à l’intérieur de fibres multimodes grâce à une technique appelée façonnage des fronts d’ondes. Cela permet la mise en œuvre de calculs optiques non linéaires avec des puissances optiques moyennes de quelques microwatts, franchissant une étape cruciale dans la réalisation du potentiel des réseaux neuronaux optiques.

« Dans cette étude, nous avons découvert qu’avec un petit groupe de paramètres, nous pouvons sélectionner un ensemble spécifique de poids de modèle parmi la banque de poids fournie par l’optique et l’utiliser pour la tâche de calcul visée. De cette manière, nous avons utilisé des phénomènes naturellement présents comme matériel informatique sans avoir à fabriquer et à exploiter un dispositif spécialisé à cette fin », déclare Ilker Oguz, co-auteur principal de l’étude.

Ce résultat marque une avancée significative pour relever les défis posés par la demande croissante de modèles d’apprentissage automatique plus grands. En exploitant la puissance de calcul de la propagation de la lumière à travers des fibres multimodes, les chercheurs ont ouvert la voie à des solutions matérielles peu énergivores et hautement efficaces en intelligence artificielle.

Comme le montre l’expérience rapportée en optique non linéaire, ce cadre de calcul peut également être mis à profit pour programmer efficacement différents phénomènes non linéaires et de haute dimension pour effectuer des tâches d’apprentissage automatique, offrant ainsi une solution transformative à la nature énergivore des modèles d’IA actuels.

Référence : « Programmation de la propagation non linéaire pour des machines d’apprentissage optique efficaces » par Ilker Oguz, Jih-Liang Hsieh, Niyazi Ulas Dinc, Uğur Teğin, Mustafa Yildirim, Carlo Gigli, Christophe Moser et Demetri Psaltis, 25 janvier 2024, Advanced Photonics.
DOI : 10.1117/1.AP.6.1.016002