Programmierbare photonische neuronale Netze, die WDM mit kohärenter linearer Optik kombinieren

May 26, 2023

Weitere Unterschriften für Freizeitmarihuana-Maßnahme in Ohio eingereicht

May 27, 2023

Rosen hebt die anhaltenden Bemühungen hervor, hoch zu landen

May 28, 2023

Was ist ein optischer Verstärker?

May 29, 2023

Gouverneur Hochul nimmt neues COVID ins Visier

May 30, 2023

Wachstumschancen und Zukunftsaussichten für den Markt für optische Verstärker im Jahr 2023

Senden Sie Ihre Anfrage

EINREICHEN

Aug 13, 2023

Programmierbare photonische neuronale Netze, die WDM mit kohärenter linearer Optik kombinieren

Scientific Reports Band 12, Artikelnummer: 5605 (2022) Diesen Artikel zitieren 4884 Zugriffe 19 Zitate 1 Details zur altmetrischen Metrik Neuromorphe Photonik hat sich bisher entweder ausschließlich auf kohärente oder kohärente Photonik verlassen

Wissenschaftliche Berichte Band 12, Artikelnummer: 5605 (2022) Diesen Artikel zitieren

4884 Zugriffe

19 Zitate

1 Altmetrisch

Details zu den Metriken

Die neuromorphe Photonik stützte sich bisher entweder ausschließlich auf kohärente Designs oder auf Wavelength-Division-Multiplexing (WDM)-Designs, um Skalarprodukt- oder Vektor-für-Matrix-Multiplikationen zu ermöglichen, was zu einer beeindruckenden Vielfalt an Architekturen geführt hat. Hier gehen wir noch einen Schritt weiter und nutzen WDM zur Anreicherung des Layouts mit Parallelisierungsfähigkeiten über Fan-In- und/oder Gewichtungsstufen hinweg, anstatt dem Rechenzweck zu dienen, und präsentieren zum ersten Mal eine Neuronenarchitektur, die kohärente Optik mit WDM kombiniert eine multifunktionale programmierbare neuronale Netzwerkplattform. Unsere rekonfigurierbare Plattform unterstützt vier verschiedene Betriebsmodi über dieselbe photonische Hardware und unterstützt mehrschichtige, Faltungs-, vollständig verbundene und energiesparende Schichten. Wir validieren mathematisch die erfolgreiche Leistung in allen vier Betriebsmodi unter Berücksichtigung von Übersprechen, Kanalabstand und spektraler Abhängigkeit der kritischen optischen Elemente und kommen zu einem zuverlässigen Betrieb mit einem relativen MAC-Fehler \(< 2\%\).

Das explosionsartige Wachstum von künstlicher Intelligenz (KI) und Deep Learning (DL) sowie die ausgereifte photonische Integration haben ein neues Fenster der Möglichkeiten für den Einsatz von Optik in Rechenaufgaben geschaffen1,2,3,4,5. Der Einsatz von Photonen und relevanten optischen Technologien in der Hardware neuronaler Netze (NN) wird voraussichtlich zu einer erheblichen Steigerung der Multiply-Accumulate (MAC)-Operationen pro Sekunde im Vergleich zu den jeweiligen elektronischen NN-Plattformen führen, wobei Rechenenergie und Flächeneffizienz voraussichtlich erreicht werden < fJ/MAC bzw. > TMAC/s/mm\(^{2}\), jeweils6,7. Der Weg zur Verwirklichung dieses NN-Hardware-Paradigmenwechsels zielt darauf ab, die hohen Leitungsraten, die durch integrierte photonische Technologien unterstützt werden, zusammen mit der kleinen Gewichtungsfunktion mit geringem Stromverbrauch zu nutzen, die im Chip-Maßstab angeboten werden kann4,8. Bisher lag der Schwerpunkt bei der überwiegenden Mehrheit der für Gewichtungszwecke verwendeten photonischen Geräte auf langsam rekonfigurierbaren Elementen wie thermooptischen (T/O) Phasenschiebern9,10 und nichtflüchtigen Speicherstrukturen auf der Basis von Phasenwechselmaterialien (PCM)4,8 Dies bedeutet, dass Inferenzanwendungen derzeit als Hauptziel im Bereich der neuromorphen Photonik angesehen werden3.

Inferenz-Engines erfordern in der Tat eine eher statische Neuronenarchitektur und einen Layer-Konnektivitätsgraphen, der normalerweise definiert wird, um eine bestimmte KI-Aufgabe optimal auszuführen. Objektverfolgung und Bildklassifizierung beispielsweise werden typischerweise über eine Reihe von Faltungsschichten durchgeführt, gefolgt von einer oder mehreren Fully Connected (FC)-Schichten, während Autoencoder kaskadierte Stufen von FC-Schichten erfordern11,12. Obwohl Faltungs- und FC-Schichten in fast allen Inferenzplattformen kritische Architekturelemente darstellen, können viele Parameter – wie die Anzahl der Schichten und/oder Neuronen pro Schicht und das Konnektivitätsdiagramm – je nach angestrebter DL-Architektur und -Anwendung erheblich variieren. Elektronische Implementierungen können auf anwendungsspezifische integrierte Schaltkreise (ASICs) hinauslaufen, die für eine bestimmte Inferenzaufgabe angepasst sind, aber die Verwendung von GPUs, TPUs oder sogar FPGAs wird unvermeidlich, wenn Neuprogrammierbarkeit und Neukonfigurierbarkeit erforderlich sind, um dieselbe Hardware für mehrere Anwendungen zu verwenden13.

Die Übertragung der Rekonfigurationsfähigkeit auf Photonic (P)-NN-Implementierungen erfordert eine Plattform, die verschiedene Funktionslayouts über dieselbe neuronale Hardware flexibel unterstützen kann. Die Programmierbarkeit in der Photonik hat in den letzten Jahren erhebliche Fortschritte gemacht14,15,16 und es hat sich gezeigt, dass programmierbare photonische integrierte Schaltkreise (PICs) wichtige Vorteile bei der Einführung kosteneffizienter, flexibler und multifunktionaler photonischer Plattformen bieten, die dem Konzept genau folgen können elektronische FPGAs17. Dabei wurde auch hervorgehoben, dass allein die Verwendung von langsam rekonfigurierbaren \(2 \times 2\) Mach-Zehnder-Interferometrie-Schaltern (MZI) innerhalb eines geeigneten Architekturschemas eine große Auswahl an Schaltungsverbindungen und Funktionalitätsoptionen ergeben kann14,15 . Allerdings muss sich die Eigenart von NN-Architekturen entlang alternativer Funktionalitäten fortsetzen, die derzeit noch nicht von programmierbaren photonischen Implementierungen angeboten werden. Obwohl modernste photonische Gewichtungstechnologie tatsächlich eine Neukonfiguration des Gewichtswerts ermöglichen kann4,8,9,10 und sich auch ein Perspektivwechsel hin zu programmierbaren Aktivierungsfunktionen abzeichnet16,18,19, wurden bisher neuromorphe photonische Architekturen demonstriert unterstützen keinen Rekonfigurationsmechanismus für ihre linearen Neuronenstadien. PNNs haben bisher zwei Hauptarchitekturkategorien für die Realisierung linearer neuronaler Schichten entwickelt, bei denen Wellenlängenmultiplex- (WDM) und kohärente Plattformen diskreten und parallelen Roadmaps zu folgen scheinen: (i) inkohärente oder WDM-basierte Layouts, bei denen eine diskrete Wellenlänge vorliegt wird für jedes Axon innerhalb desselben Neurons verwendet3,4,20 und (ii) kohärente interferometrische Schemata, bei denen eine einzelne Wellenlänge über das gesamte Neuron hinweg verwendet wird und Interferenzen zwischen kohärenten elektrischen Feldern für gewichtete Summenoperationen ausgenutzt werden9,10.

Hier präsentieren wir eine neuartige Architektur, die WDM und kohärente Photonik effizient kombinieren kann, um programmierbare PNNs (PPNNs) mit vier verschiedenen Betriebsmodi der linearen neuronalen Schicht zu unterstützen. Ausgehend von unserer kürzlich vorgeschlagenen kohärenten linearen Dual-IQ-Neuronenarchitektur21, die kürzlich auch als PIC mit bahnbrechenden Rechenraten pro Axon22,23 demonstriert wurde, erweitern wir die Einzelneuronenarchitektur durch den Einsatz mehrerer Wellenlängenkanäle und entsprechendes WDM-De/Multiplexing (DE/MUX) Strukturen zur Schaffung von Multi- und Single-Element-Fan-In (Eingabe) und Gewichtsstufen pro Axon. Die Programmierbarkeit wird dann durch \(2 \times 2\) MZI-Schalter erzwungen, die die Konnektivität zwischen Fan-In- und Gewichtungsstufen flexibel definieren können und auf diese Weise softwaredefinierte Topologien neuronaler Schichten ermöglichen. Wir formulieren den mathematischen Rahmen für diese programmierbare neuromorphe Architektur und fahren mit einer eingehenden Untersuchung der zu erwartenden Leistungsbeeinträchtigungen fort, die durch die Verwendung mehrerer Wellenlängen innerhalb derselben interferometrischen Anordnung entstehen. Wir kommen zu einem einfachen Mechanismus, um dem wellenlängenabhängigen Verhalten von Modulatoren und Phasenschiebern in der Fan-In- bzw. Gewichtungsphase entgegenzuwirken, und zeigen, dass unser programmierbares Layout für jede Anzahl verwendeter optischer Kanäle in jedem der vier verschiedenen Modi gleich gut funktioniert des Betriebs, wobei alle unterstützten Neuronen immer einen relativen Fehler von weniger als \(2\%\) bieten, solange das Übersprechen zwischen den Kanälen auf typischen Werten von weniger als \(-\,20 \, \mathrm {dB} gehalten wird \).

In unserer aktuellen Studie21 haben wir gezeigt, wie kohärente lineare Neuronen, die Skalarprodukt-Funktionalität bieten, aus IQ-Modulatorblöcken konstruiert werden können, wodurch die Vorzeicheninformationen (in der Phase des Signals kodiert) durch Einführung des Vorspannungssignals \( \Sigma w_i x_i + b\), wodurch das Neuron mit den rein optischen nichtlinearen Aktivierungsfunktionen \(f_\mathrm {NL}(\cdot )\) kompatibel wird, die entweder auf das elektrische Feld oder auf die optische Leistung zugeschnitten sind, ohne dass Informationen darunter leiden Verlust. Da der Wellenlängenbereich ungenutzt ist, entwickeln wir unsere ursprüngliche Neuronenarchitektur weiter, um mehrere Kanäle unterzubringen und eine Parallelisierung zu erreichen, wie in Abb. 1 dargestellt.

(a) Schematische Darstellung von PPNN mit M Laserdioden (LDs), einem MUX, einem 3-dB-X-Splitter, gefolgt von einem Vorspannungszweig (\(W_\mathrm {b}\)) und einem rekonfigurierbaren OLAU, der 1-zu-N umfasst Aufteilungsstufe, Eingangs- (\(X_n\)) und Gewichtungsmodulatorbänke (\(W_n\)) sowie eine N-zu-1-Kombinatorstufe, deren Ausgang dazu gebracht wird, mit dem Vorspannungssignal innerhalb des 3dB-X-Kopplers zu interferieren an den DEMUX gesendet. Schauen Sie sich (b) die 1-zu-N-Aufspaltung und (d) ihre \(\pi\)-rotierte N-zu-1-Kopplungsstufe genauer an. Vergrößern Sie den (c) Bias-Zweig wellenlängenselektiver Gewichte und Phasenmodulatoren und (e) ein Axon des OLAU, bestehend aus Schaltern für die Signalweiterleitung und Modulatoren für Eingänge (\(x_{n,m}\)) und Gewichte ( \(w_{n,m}\)).

Wie Abb. 1a zeigt, bleibt das Rückgrat unserer neuronalen Schicht ähnlich wie in21, mit den Hauptunterschieden: (i) ein einzelnes optisches Continuous Wave (CW)-Eingangssignal wird jetzt durch M gemultiplexte CW-Signale ersetzt, die jeweils bei \(\ zentriert sind). lambda _m\) und unterstützt ein unabhängiges virtuelles Neuron, und (ii) Eingabe- und Gewichtsmodulatoren werden jetzt durch ausgefeiltere Modulatorbänke ersetzt, die in Abb. 1c, e dargestellt sind und im letzteren Fall durch softwaresteuerbare Schalter begrenzt sind. Das mehrkanalige Eingangssignal wird zunächst durch einen 3-dB-X-Koppler in den Teil aufgeteilt, der zum Bias-Zweig geleitet wird, und der verbleibende Teil gelangt in die Optical Linear Algebraic Unit (OLAU). Innerhalb der OLAU wird das Signal durch einen 1-zu-N-Splitter, für den ein Beispiel in Abb. 1b dargestellt ist, hinsichtlich der Leistung weiter aufgeteilt und nach entsprechender Modulation durch Eingänge \(x_{n,m} \) und über Gewichte \(w_{n,m}\) berechnet, wird an den N-zu-1-Kombinierer gesendet, wie in Abb. 1d dargestellt. In diesem Stadium interferiert das Ausgangssignal mit der Vorspannung innerhalb eines 3-dB-X-Kopplers und wird an den DEMUX weitergeleitet, um die Ausgänge \(y_m\) zu erzeugen. Schließlich verfügt jeder Kanal m über eine eigene algebraische Addition der gewichteten Eingaben mit einem bestimmten Bias, was insgesamt M unabhängige N-Fan-In-Neuronen ergibt.

Abhängig von der Konfiguration der Schalter, über die in Tabelle 1 ein Überblick gegeben wird, können Kanäle innerhalb eines einzelnen Axons aus Abb. 1e entweder einzeln oder durch einen gemeinsamen Modulator gesteuert werden, sodass das Netzwerk wie folgt arbeiten kann:

Multi-Neuron (M unabhängige N-zu-1-Neuronen), was einen beliebigen logischen Verbindungsgraphen ermöglicht und sogar einen mehrschichtigen Betrieb unterstützt, indem unterschiedliche Neuronen verschiedenen Schichten des NN zugewiesen werden;

Faltung (M unabhängige N-Element-Eingaben mit einem einzelnen Kernel der Größe N), wobei alle verschiedenen Eingabevektoren denselben Satz von Gewichten durchlaufen, Abb. 2c, wodurch eine gleichzeitige M-fache Nutzung desselben Kernels erreicht wird, wodurch die Faltungsoperation beschleunigt wird Abb. 2b;

Vollständig verbunden (FC) (einzelner N-Element-Eingang über M Neuronen), wobei ein einzelner Eingang alle M verfügbaren Gewichtssätze mit jeweils der Größe N durchläuft, was eine vollständige Konnektivität zwischen allen Ein- und Ausgängen ermöglicht, Abb. 3a, c;

Energieeinsparung (einzelnes N-zu-1-Neuron), die zwar aufgrund des großen Footprint-Einbußens und des geringen aggregierten Durchsatzes keine primär gezielte Betriebsart ist, aber dennoch eine Ressourceneinsparung durch Abschalten der überschüssigen Kanäle ermöglicht und kann nützlich, wenn NN gelegentlich sequentiell arbeiten muss (ein Neuron nach dem anderen).

(a) Vereinfachtes CNN, inspiriert von LeNet-5, verwendet bei der Bildklassifizierung. (b) Schematische Darstellung einer Faltungsschicht mit farbcodierten Eingabe-/Ausgabepaaren und (c) ihre Implementierung über PPNN im Modus Nr. 2, wobei jeder Kanal m einem Eingabe-/Ausgabepaar entspricht.

(b) Schema eines Autoencoders und (a), (c) seiner beiden FC-Schichten, implementiert über PPNN im Modus Nr. 3, wobei Kanäle eindeutigen Gewichtsvektoren und Ausgaben \(y_m\) entsprechen. Basierend auf dem Konnektivitätsdiagramm aus (b) geht die Implementierung von der Verwendung von (a) 4 Zweigen und 2 Wellenlängen in der ersten Schicht und (c) 2 Zweigen und 4 Wellenlängen in der zweiten Schicht aus. Wenn die Anzahl der verfügbaren Zweige N größer als erforderlich ist, werden die Eingänge aller überschüssigen Zweige auf 0 gesetzt (beachten Sie den N-ten Zweig in (a), (c), wo die Bedingung \(N>4\) und \( N>2\) wird jeweils auferlegt). Der Index n in der Implementierung (a) wird auf \(n \le 4\) gesetzt, um anzuzeigen, dass der lit-n-te Zweig eine Eingabe ungleich Null trägt. Wenn die Anzahl der verfügbaren Wellenlängen M die Anzahl der erforderlichen übersteigt, werden die überschüssigen LDs ebenfalls abgeschaltet.

Eine detaillierte Zuordnung zwischen der Architektur aus Abb. 1 und den aufgeführten Betriebsmodi finden Sie in Abschnitt 1, Ergänzungsdokument, wobei einige Beispiele auch in den Abbildungen aufgeführt sind. 2 und 3. Faltungs- und FC-Betriebsarten sind aufgrund ihrer allgegenwärtigen Präsenz in tiefen NNs, insbesondere in den weit verbreiteten Faltungs-NNs (CNNs), besonders wichtig, Abb. 2a11. Sowohl in der Faltungs- als auch in der Pooling-Schicht wird ein einzigartiger Kernel (Filter- oder Gewichtungsfenster) scannend mit einem bestimmten Schritt auf die Eingaben angewendet, was einen einzelnen Ausgabewert ergibt, wie in Abb. 2b schematisch dargestellt und in Abb. über PPNN implementiert. 2c. Andererseits verfügt die FC-Schicht, die in Abb. 3a, c über PPNN implementiert dargestellt ist, über einen einzelnen Satz von Eingaben, der mehrere Sätze von Gewichtungen durchläuft, um die Ausgänge zu erzeugen, und ist der Hauptbaustein von Autoencodern, Abb. 3b mit der Notwendigkeit in CNNs, Abb. 2a. Beide Vorgänge sind zeit- und energieaufwändig, wenn sie sequenziell durchgeführt werden, was bedeutet, dass sie von der Parallelisierung stark profitieren.

Obwohl die Schalter verschiedener Axone unabhängig voneinander gesteuert werden können, ist für die resultierende gemischte NN-Schicht derzeit keine Anwendung vorgesehen. Daher gehen wir davon aus, dass Schalter in allen Zweigen auf folgende Weise synchronisiert sind: \(S_{\mathrm {X},n} = S_\mathrm {X}\), \(S_{\mathrm {W},n} = S_\mathrm {W}\) und \(S_{\mathrm {O},n} = S_\mathrm {O}, \forall n\). Die Matrizen, die die Werte der Eingaben \(X_n\) und Gewichte \(W_n\) für verschiedene Betriebsmodi kapseln, sind in Tabelle 2 zusammengefasst, wobei \(I_M\) für \(M \times M\) steht. Identitätsmatrix. Eingaben erfordern nicht mehr als einen Amplitudenmodulator pro Wert, da sie auf der positiven Domäne \(x_{n,m} \in [0,1]\) definiert sind, während im Fall von Gewichten diese sowohl positiv als auch sein können negativ, \(w_{n,m} \in [-1,1]\), sind zwei Modulatoren erforderlich, einer für die Amplitude, die proportional zur Gewichtsgröße ist, \(|w_{n,m}| \), und der Rest für die Phase, die das Vorzeichen des Gewichts tragen wird, \(\varphi _{n,m} = [1 - \mathrm {sgn}(w_{n,m})]\pi /2\).

Der in Abb. 1c dargestellte Bias-Zweig unterscheidet sich vom Axon-Zweig in Abb. 1e in zwei Aspekten: (i) er verfügt über keinen bzw. keine Eingangssequenzmodulatoren; (ii) Es gibt nur einen möglichen Weg, den das Signal nehmen kann, mit einer separaten Steuerung der Phase und Amplitude jedes Kanals. Letzteres ist eine Gegenmaßnahme zur erwarteten wellenlängenabhängigen Variation der Eingabe- und Gewichtsgrößen, wenn in jedem Axon des OLAU ein einzelner Phasen- und Amplitudenmodulator verwendet wird. Darüber hinaus ermöglicht es die Kompensation potenziell unterschiedlicher Übertragungskoeffizienten und Phasenversätze, die durch verschiedene Kanäle innerhalb von OLAU akkumuliert werden, wodurch die Bedingungen für konstruktive Interferenz am letzten 3-dB-Koppler des PNN erfüllt werden. Die Bias-Matrix bleibt für alle Betriebsarten gleich und lautet \(W_\mathrm {b} = \mathrm {diag} [w_{\mathrm {b},1}, \ldots , w_{\mathrm {b},M }]\), wobei \(w_{\mathrm {b},m} = |w_{\mathrm {b},m}| \exp ( i\varphi _{\mathrm {b},m} )\) .

Nehmen wir an, dass der optische Träger aus M Kanälen \(\lambda _m\) besteht und durch einen \(M \times 1\) Spaltenvektor elektrischer Felder \(\mathrm {E}_\mathrm {LD } = [E_{\mathrm {LD},1}, \ldots , E_{\mathrm {LD},M}]^\mathrm {T}\), die so normiert sind, dass ihre Größe im Quadrat die optische Leistung ergibt, d. h , \(E_{\mathrm {LD},m} = \sqrt{P_{\mathrm {LD},m}} \exp (i \varphi _{\mathrm {LD},m})\). In Anlehnung an die in Abb. 1 dargestellte Architektur und die detaillierte Ableitung in Abschnitt 2 des Zusatzdokuments finden wir den Spaltenvektor elektrischer Felder am Ausgang von PPNN als

Dabei wird, um konstruktive Interferenz am letzten 3-dB-X-Koppler von Abb. 1a sicherzustellen, eine Phasenanpassung zwischen der Vorspannung und dem von OLAU kommenden Signal durchgeführt. Ersteres geschieht durch \({\widetilde{W}}_\mathrm {b} = W_\mathrm {b} \exp (-i \pi /2)^{\log _2 N}\), was die bezeichnet Kanalweise Übertragungsmatrix mit Vorspannungszweig, die die Phasenausrichtung berücksichtigt, wobei ihr m-tes Element \({\widetilde{w}}_{\mathrm {b},m} = |w_{\mathrm {b},m}| \ exp ( i\varphi _{\mathrm {b},m} ) \exp (-i \pi /2)^{\log _2 N}\). Ohne Berücksichtigung der akkumulierten Phasenverschiebung und Verluste, die für alle Kanäle identisch sind, kann die Übertragungsmatrix des PPNN, \(\mathrm {Q}_\mathrm {t}\), geschrieben werden als

Das m-te Element der \(\mathrm {Q}_\mathrm {t}\)-Matrix, \(q_{\mathrm {t},m}\), gegeben durch Gl. (2b) für den Multi-Neuronen-Betriebsmodus (#1) enthüllt das zugrunde liegende Funktionsprinzip unseres PPNN und zeigt, wie das normalisierte Skalarprodukt zwischen den über Axone dargestellten N-Element-Vektoren \([w_{1,m} , \ldots , w_{N,m}]\) und \([x_{1,m}, \ldots , x_{N,m}]\), kann am Ausgang des m-ten Kanalneurons mit Bias \( {\widetilde{w}}_{\mathrm {b},m}\) überlagert. Die Rekonfigurierbarkeit von PPNN ist in Gl. verborgen. (2a), wobei die Wahl der Matrizen \(X_n\) und \(W_n\) durch die Funktionsweise gemäß Tabelle 2 bestimmt wird, was zu alternativen Funktionalitäten führt. Im Faltungsmodus (#2) ein einzelner Kernel wie in Abb. 2b, d. h. ein einzelner Satz von Gewichten über verschiedene Kanäle hinweg \([w_{1,0}, \ldots , w_{N,0}]\), erfordert einen gemeinsamen Gewichtsmodulator pro Axon, da \(w_{n,m} = w_{n,0}, \forall m\), während die Eingabevektoren über die Kanäle hinweg unterschiedlich bleiben, \([x_{1,m}, \ldots , x_{N,m}]\), was zu einer M-fachen Parallelisierung und damit Beschleunigung der Faltungsoperation führt. Andererseits erfordert im FC-Modus (#3) ein einzelner Eingabevektor \([x_{1,0}, \ldots , x_{N,0}]\) einen Eingabemodulator \(x_{n ,0}\) pro n-tem Axon wird durch mehrere, kanalselektive Gewichte \([w_{1,m}, \ldots , w_{N,m}]\ geleitet, was eine vollständige Konnektivität zwischen allen N Eingängen ergibt \ (x_{n,0}\) und alle M Ausgänge \(y_m\), wie in Abb. 3b dargestellt. Schließlich werden im Energiesparmodus (#4) eindeutige Gewichts- und Eingabevektoren, \([w_{1,0}, \ldots , w_{N,0}]\) und \([x_{1,0} , \ldots , x_{N,0}]\), ermöglichen die Verwendung nur eines Kanals und das Ausschalten der übrigen Kanäle und bieten die gleiche Funktionalität wie unsere Dual-IQ-Skalarprodukt-Engine von21 ohne zusätzliche Leistungseinbußen Verbrauch oder Durchsatz pro Kanal, allerdings leidet er unter der durch die PPNN-Programmierbarkeit und das Mehrkanaldesign bedingten Footprint-Einbuße. Dieser Betriebsmodus ist sicherlich nicht der bevorzugte, aber wenn die Rekonfigurierbarkeit ein notwendiges Merkmal des Systems ist, beispielsweise in Prototyping-Phasen, kann man Strom sparen, wenn man mit sequentiellen Vorgängen konfrontiert wird, die typischerweise die parallelen Vorgänge umfassen, in Form von Einrichtungs- und Analyseverfahren.

Wie bereits erwähnt, gilt Gl. (2b) ist für Modus Nr. 1 angegeben, kann aber auf jeden anderen aktualisiert werden, indem das kanalspezifische \(x_{n,m}\) und/oder \(w_{n,m}\) durch ein Gelenk ersetzt wird \(x_{n,0}\) und/oder \(w_{n,0}\). Sofern nicht ausdrücklich anders angegeben, verwenden wir im Folgenden der Einfachheit und Klarheit halber die Notationen \(x_{n,m}\) und \(w_{n,m}\) für einen beliebigen Betriebsmodus.

In bestimmten Anwendungsszenarien, wie etwa der Bildklassifizierung, Abb. 2a, b, ist es praktisch, die Anzahl der Axone als Quadrat der linearen Filterdimension (Kernel) zu wählen, die typischerweise eine ungerade Zahl ist, was z. B. zu \( N = 3 \times 3\) oder \(N = 5 \times 5\). Einige andere Anwendungen erfordern möglicherweise ein beliebiges N, nicht unbedingt ein Quadrat. In diesem Fall können zwei Ansätze gewählt werden, um die PPNN-Architektur aus Abb. 1 zu nutzen, wobei zu berücksichtigen ist, dass Splitter und Combiner aus Abb. 1b, d unter der Annahme entwickelt wurden, dass N eine Potenz von 2 ist. Der erste Ansatz ist unkompliziert und geht davon aus Verwenden der N benötigten Axone und Ignorieren der verbleibenden Axone, die die nächste Potenz von 2 größer als N ergänzen. In diesem Fall geht ein gewisser Betrag an optischer Leistung verloren, der jedoch proportional zu \(N/ 2^{ \lceil \log _2 N \rceil }\), wird der Verlust niemals 3 dB überschreiten. Der zweite Ansatz zielt darauf ab, Leistungsverluste auf Kosten einer Neukonstruktion des Splitters und Kombinierers zu beseitigen und eine identische Phasenverschiebung auf allen Pfaden sicherzustellen, was zur Erhaltung der Kohärenz zwischen den Signalen führt, die sich entlang verschiedener Axone bewegen. Der Algorithmus zum Entwerfen eines solchen Splitters und des entsprechenden Combiners wird in Abschnitt 3 des Ergänzungsdokuments vorgestellt.

Der Betrieb von PPNN im Energiesparmodus mit einem einzelnen aktiven Kanal eröffnet die Möglichkeit, die DE/MUXes in Axonen zu umgehen und alle passiven (Splitter, Combiner) und aktiven Komponenten (Schalter, Eingangs- und Gewichtsmodulatoren) auf die zentrale Wellenlänge des Kanals zu zentrieren. Es bleibt kein Spielraum für eine Leistungsverschlechterung aufgrund wellenlängenabhängiger Eigenschaften optischer Komponenten. Andererseits wirft ein Mehrkanal-PPNN (Modi Nr. 1 bis Nr. 3) zu Recht Bedenken auf, ob alle Kanäle die gleiche Leistung erbringen und ähnliche relative Fehler zwischen der Zielausgabe aufweisen, die durch das Matrixelement \(q_{\mathrm {t},m}\) in Gl. (2b) und experimentell erhaltener Wert \(q_{\mathrm {e},m}\). Der wellenlängenabhängige Verlust und die Phasenakkumulation zusammen mit dem Übersprechen in DE/MUXes könnten zu einer Leistungsverschlechterung einiger Kanäle in einem stärkeren Ausmaß als bei anderen führen, gemessen an der Erhöhung des absoluten Werts \(\Delta q_m = q_{\mathrm {e} ,m} - q_{\mathrm {t},m}\) und relativer Fehler, \(\delta q_m = |\Delta q_m|/q_{\mathrm {t},m}\), zwischen den Matrixelementen . Das Festlegen der Grenze für den tolerierbaren relativen Fehler kann eine anspruchsvolle Aufgabe sein, da die Fehlertoleranz des Netzwerks von der Aufgabe, in der es eingesetzt wird, und vom Trainingsalgorithmus abhängt. Als Faustregel gilt, dass ein akzeptabler PPNN-Fehler niedriger sein sollte als der Trainingsfehler, der üblicherweise im Bereich von wenigen Prozent liegt21,22,23. Darüber hinaus hat sich gezeigt, dass der Einsatz von rauschbewussten Trainingsalgorithmen die Belastbarkeit der NN-Modelle auch in einer verrauschten Umgebung erhöht24, wo das Rauschen als weit gefasster Begriff verstanden werden sollte, der jede zufällig verteilte Abweichung von der Zielausgabe umfasst. Im Anschluss an das oben Gesagte untersuchen wir in diesem Abschnitt, wie stark die experimentelle PPNN-Transfermatrix \(\mathrm {Q}_\mathrm {e}\) von der angestrebten Matrix \(\mathrm {Q}) abweichen wird. _\mathrm{t}\) und ob dieser Abweichung entgegengewirkt werden kann.

Wir beginnen unsere Analyse mit der Untersuchung der Auswirkung der Wellenlängenabhängigkeit von X-Kopplern, die zum Teilen und Kombinieren von Stufen verwendet werden, sowie von optischen Schaltern, die für die Signalweiterleitung innerhalb der Axone verwendet werden. Im Folgenden wird davon ausgegangen, dass die Anzahl der Axone N eine Zweierpotenz ist, was bedeutet, dass die Teilungs- und Kombinationsstufen aus kaskadierten 3-dB-X-Kopplern bestehen. Dennoch können alle Schlussfolgerungen auf eine beliebige Anzahl von Axonen N verallgemeinert werden, indem dem in Abschnitt 3 des Ergänzungsdokuments beschriebenen Splitter/Combiner-Design gefolgt wird. Das wellenlängenabhängige Leistungsteilungsverhältnis des Kopplers für den m-ten Kanal kann als \(\alpha _m = 1/2 + \Delta \alpha _m\) geschrieben werden, wobei \(\Delta \alpha _m\) die Abweichung des Koeffizienten vom bezeichnet Zielwert von 1/2. Es wird angenommen, dass alle drei Schalter, \(S_\mathrm {X}\), \(S_\mathrm {W}\) und \(S_\mathrm {O}\), wellenlängenabhängige Verlusteinbußen einführen, so dass die Die Menge der an den aktiven Port weitergeleiteten optischen Leistung ist proportional zu \(s_m \le 1\). Gemäß der detaillierten Studie, die in Abschnitt 4 des Zusatzdokuments beschrieben wird, finden wir das elektrische Ausgangsfeld von PPNN in einer Spaltenvektorform

wobei \(\mathrm {S} = \mathrm {diag} \left[ \sqrt{s_1} , \ldots , \sqrt{s_M} \right]\) die Übertragungsmatrix des Schalters bezeichnet und \(\mathrm {A }_\mathrm {bar/cross} = \mathrm {diag} \left[ \sqrt{1 \mp 2 \Delta \alpha _1} , \ldots , \sqrt{1 \mp 2 \Delta \alpha _M} \right ]\) steht für die Balken-/Kreuzübertragungsmatrix eines X-Kopplers, beide wellenlängenabhängig. Um die konstruktive Interferenz am 3dB-Ausgangskoppler sicherzustellen und die Vorzeichenintegrität des resultierenden Ausgangsfeldes zu wahren, ist eine Phasenkompensation und ein Verlustausgleich pro Kanal innerhalb des Vorspannungszweigs erforderlich, was durch eine modifizierte Gewichtsmatrix \({\widetilde{W}}_ erreicht wird. \mathrm {b}\), mit seinem m-ten Element

Sowohl der Koeffizient für \(w_{\mathrm {b},m}\) in (4) als auch der für \(\mathrm {Q}_\mathrm {t}\) in (3) hängen nur von den Eigenschaften ab der Schalter und X-Koppler und bleiben unabhängig von der Eingangsreihenfolge und/oder den Wägungen unverändert. Vergleicht man (3) mit dem durch (1)–(2) gegebenen Idealfall, so erkennt man, dass die Interferenzbedingung durch individuelle Steuerung der Vorspannungsamplitude und -phase gemäß (4) erfolgreich erfüllt wird. Verschiedene Kanäle werden sicherlich unterschiedliche Verlustmengen ansammeln, dieser Unausgeglichenheit kann jedoch leicht entgegengewirkt werden, indem ein Satz variabler optischer Dämpfungsglieder (VOAs) am demultiplexten Ausgang des PPNN eingesetzt wird (siehe Abb. 1a). Da wir die Möglichkeit haben, diese Herausforderung außerhalb des PPNN-Kerns zu lösen, gehen wir von diesem Punkt an davon aus, dass die Wellenlängenabhängigkeit von X-Kopplern und Schaltern nicht kritisch ist, und konzentrieren uns auf die Beeinträchtigungen, die zu einer Verschlechterung der Zielmatrix führen können \( \mathrm{Q}_\mathrm{t}\).

Zur Implementierung der Eingaben \(x_{n,c}\) verwenden wir in unserer Studie Mach-Zehnder-Modulatoren (MZMs), wobei c der Index des Kanals \(\lambda_c\) ist, auf dem der MZM zentriert ist. Wir gehen davon aus, dass MZMs über spannungsgesteuerte Phasenschieber (PS) in beiden Armen verfügen (indiziert als „1/2“ für Ober- bzw. Unterarm) und in einer Push-Pull-Konfiguration mit gleichstrominduzierten Phasenverschiebungen betrieben werden, die als \(\ phi _{\mathrm {DC},1/2} = 2\pi n(V_{\mathrm {DC},1/2}, \lambda ) L_\mathrm {DC}/\lambda\) und RF induziert als \(\phi _{1/2}(\pm V_\mathrm {RF}, \lambda) = \phi _0 (\lambda) \pm \Delta \phi (V_\mathrm {RF}, \lambda)\) mit \(\phi _0 = 2\pi n_0(\lambda ) L /\lambda\) und \(\Delta \phi = 2\pi \Delta n(V_\mathrm {RF}, \lambda ) L /\lambda \), wobei L und \(L_\mathrm {DC}\) die Längen der RF- und DC-aktiven Regionen bezeichnen und \(n = n_0 + \Delta n\), mit \(n_0\) und \(\Delta n\ ) ist der Brechungsindex bei angelegter Spannung Null und seine Abweichung beim Anlegen der Spannung. Die Übertragungsfunktion des MZM ist gegeben als

und ist so zugeschnitten, dass \(t_\mathrm {MZM} (\lambda _c) = x_{n,c}\) durch Auswahl der Gleichspannungen (Vorspannungen), die Phasenverschiebungen im Abstand von \(\pi\) induzieren, was \ impliziert (\phi _{\mathrm {DC},1} = \phi _\mathrm {DC} - \pi\) und \(\phi _{\mathrm {DC},2} = \phi _\mathrm {DC }\). Unter der Annahme, dass die modulationsinduzierte Phasenvariation nicht wesentlich zur gesamten Wellenlängenabhängigkeit beiträgt, kann die MZM-Übertragungsfunktion angenähert werden durch

Für die Betriebsmodi Nr. 3 und Nr. 4 wird die MZM-Übertragungsfunktion auf ein bestimmtes \(\lambda_c\) zentriert, d \(\Delta \phi (V_\mathrm {RF}, \lambda _c) = \arcsin x_{n,c}\) und das Setzen des Arguments der Exponentialfunktion in Gl. (5) auf ein Vielfaches von \(2\pi\). Für jeden anderen Kanal m weicht der eingeprägte Wert \(x_{n,m,c}\) vom angestrebten Wert ab. Nach der detaillierten Analyse der Eingangsmodulatoroperation in Abschnitt 5 des Zusatzdokuments unter Berufung auf die Taylor-Entwicklung 1\(\mathrm{{st}}\) der Ordnung der Phasen \(\phi _0 (\lambda )\) und \(\phi _\mathrm {DC} (\lambda )\) um \(\lambda _c\), finden wir, dass der m-te Kanal des n-ten Axons den Eingabewert trägt, der durch gegeben ist

wobei \(p_x = n_0(\lambda _c) L/\lambda _c\) und \(q_x = n(V_\mathrm {DC},\lambda _c) L_\mathrm {DC}/\lambda _c\) stehen normalisierte Längen von HF- und DC-Phasenschiebern innerhalb des MZM und sind beschränkt auf \(p_x, q_x \in {\mathbb {N}}\), \(n_\mathrm {g}\) ist der Gruppenbrechungsindex und \ (\Updelta \lambda_1 = \lambda_{m+1} - \lambda_m\) bezeichnet den Kanalabstand (unter der Annahme äquidistanter Kanäle). Der Parameter \(\xi _{m,c}^{(x)}\) stellt die durch Kanal m akkumulierte Phasenverschiebung dar und enthüllt vier wichtige Fakten: (i) Er hängt nicht von der angestrebten \(x_{n,c} \) Wert, der impliziert, dass die Phasenakkumulation nicht mit der Eingabesequenz variiert; (ii) es hängt nicht vom Axonindex n ab, was bedeutet, dass alle Axone das gleiche Ausmaß an Phasenakkumulation einführen, das außerhalb der OLAU und nicht innerhalb der OLAU selbst kompensiert werden kann; (iii) es hängt von der Differenz zwischen m und c ab, was bedeutet, dass alle Seitenkanäle derselben Ordnung die gleiche Phasenakkumulation aufweisen, deren Größe mit \(|mc|\) zunimmt; (iv) sie nimmt mit dem Kanalabstand \(\Delta \lambda _1\) zu.

Um die Gewichte \(w_{n,c}\) zu implementieren, kann eine Kombination aus MZM und einem unabhängigen PS verwendet werden. Abhängig von der angestrebten Anwendung kann die Amplitudenmodulation entweder durch Absorptionssteuerung4,8,23 oder durch den Einsatz interferometrischer Module9,10,22 unter Verwendung von T/O- oder E/O-PSs erreicht werden. In Anlehnung an die Mehrzahl der gemeldeten kohärenten Layouts auf dem neuesten Stand der Technik, die auf Inferenz abzielen und somit langsame Rekonfigurationsraten ermöglichen, wählen wir thermisch gesteuerte PSs sowohl innerhalb der MZM-Arme als auch im folgenden PS. Hier stellen wir fest, dass die Kointegration der E/O-Modulatoren (Eingang) und T/O-Modulatoren (Gewicht) eine sorgfältige Planung erfordert, um thermisches Übersprechen zu vermeiden, sich aber in den letzten Jahren zu einem gut etablierten Prozess mit bedeutenden On-Chip-Demonstrationen entwickelt hat von kointegrierten E/O- und T/O-Strukturen sowohl in den Bereichen siliziumbasierter Transceiver25 als auch in der neuromorphen Photonik22,23. Bei Bedarf können zusätzlich thermisch isolierende Gräben und/oder Wärmeshunts26,27 oder ausgefeiltere Ansätze wie die thermische Eigenmodenzerlegung28 eingesetzt werden, um den zuverlässigen Betrieb beider Gerätetypen in verschiedenen PIC-Plattformen, einschließlich Si- und InP-Plattformen, sicherzustellen. Im Gegensatz zum E/O MZM kann der T/O MZM nicht in Push-Pull-Konfiguration betrieben werden; Stattdessen kann es asymmetrisch gemacht werden, indem die Länge des/der Wellenleiter(s) in einem oder beiden seiner Arme geändert wird, um eine eingebaute Phasendifferenz von \(2 \theta\) bei der Nenntemperatur \(T_0\) zu erreichen \(\lambda _c\), oder mit anderen Worten, es wird am \(2\theta\)-Punkt voreingenommen sein. Zu jedem Zeitpunkt wird nur ein PS zum Anpassen der Gewichtsgröße abhängig vom Verhältnis von \(|w_{n,c}|\) und \(\cos \theta\) verwendet. Dies spiegelt sich in der elektrischen Feldübertragungsfunktion des MZM-PS-Systems wider

wobei \(\phi (T_0, \lambda ) = 2\pi n (T_0, \lambda ) L/\lambda\) die im MZM bei \(T_0\), \(\Delta \phi (\Delta T, \lambda ) = 2\pi \Delta n (\Delta T, \lambda ) L/\lambda\) ist die Phasenverschiebung aufgrund der angelegten Differenztemperatur \(\Delta T\) und \(\phi _3 ( T, \lambda ) = 2\pi n (T, \lambda ) L_3/\lambda\) ist die im eigenständigen PS akkumulierte Phase. Ähnlich wie im Fall des Eingabe-MZM können wir den Beitrag der \(\Delta \phi\)-Variation mit der Wellenlänge vernachlässigen und die MZM-PS-Übertragungsfunktion durch approximieren

unter Berücksichtigung, dass es bei \(\lambda _c\) zentriert sein wird, was \(t_\mathrm {MZM-PS} ( \lambda _c ) = w_{n,c}\ ergibt, was auch \(\phi (T_0) impliziert , \lambda _c) = 2 p_w \pi\) und

wobei \(p_w, p_s \in {\mathbb {N}}\). Für jeden Kanal \(m \ne c\), wobei wir auf die Näherung 1. Ordnung beschränkt bleiben und \(p_w, p_s \gg 1\) annehmen, was in allen Fällen von praktischem Interesse erwartet wird, gemäß der detaillierten Ableitung in Abschnitt 6 von Im Ergänzungsdokument stellen wir fest, dass der m-te Kanal des n-ten Axons das Gewicht trägt

wobei \(p_w = n(T_0,\lambda _c) L/\lambda _c\) und \(p_s = n(T_0,\lambda _c) L_3/\lambda _c\) normalisierte Längen der PSs innerhalb des MZM darstellen und jeweils das eigenständige PS, wobei L und \(L_3\) ihre Längen sind. Dieselben Schlussfolgerungen, die zuvor für \(\xi _{m,c}^{(x)}\) gezogen wurden, gelten auch für \(\xi _{m,c}^{(w)}\).

Für das Multiplexen und Demultiplexen von Signalen werden Arrayed Waveguide Gratings (AWGs) mit einem flachen kanalweisen Spektralverhalten über das interessierende Frequenzband verwendet. Wir gehen davon aus, dass die Leistungsübertragungsfunktion des AWG als Parabel im logarithmischen Bereich, symmetrisch und auf der Wellenlänge des Kanals zentriert ist, und dass sie vernachlässigbare Gesamtverluste mit sich bringt. Im linearen Bereich entspricht die Übertragungsfunktion der Fernfeldform, dh einer Gaußschen Funktion über der Wellenlänge29. Das Übersprechen des AWG, definiert als das Verhältnis der Leistungen des ersten unterdrückten Kanals und des Durchgangskanals, wird linear als \(r_\mathrm {AWG}\) oder \(R_\mathrm {AWG}\) bezeichnet. im logarithmischen (dB) Bereich. Im Folgenden gehen wir von einem Einfügungsverlust (IL) von Null aus und beschränken uns auf die Näherung 1\(\mathrm{{st}}\)-Ordnung, bei der davon ausgegangen wird, dass das Übersprechen nur zwischen benachbarten Kanälen relevant ist. Wir gehen auch davon aus, dass die Krümmung des frei ausbreitenden Ausgangsbereichs des AWG mit der Krümmung des Gaußschen Feldes (seiner Gleichphasenlinie in der Transversalebene) übereinstimmt, was zu einer Phasendifferenz von Null zwischen benachbarten Ausgangswellenleitern führt.

Beim Durchlaufen des DEMUX wird der Kanal m nicht nur auf den m-ten Ausgangsport, sondern auch auf die Ports \((m \pm 1)\ verteilt, wobei das Verhältnis der Leistungen durch \(r_\mathrm {AWG}) bestimmt wird. \). Dies führt dazu, dass der m-te Kanal in benachbarten Wellenleitern durch Eingabe oder Gewichtung moduliert wird, die auf die Kanäle \((m \pm 1)\) ausgerichtet sind. Anschließend folgt bei der Erfassung durch den MUX ein umgekehrter Prozess, der alle Signale zurück zum Ausgang sammelt, was zu einer Mischung der Eingänge oder Gewichtungen der drei benachbarten Pfade mit den entsprechenden Koeffizienten führt. Nach der detaillierten Herleitung in Abschnitt 7 des Zusatzdokuments stellen wir fest, dass der tatsächliche, eingeprägte Wert der Eingabe in den Betriebsarten Nr. 1 und Nr. 2 vom angestrebten Wert abweicht

unter der Nebenbedingung \(x_{n,0} = x_{n,M+1} = 0\) und mit der gleichen Formalik, die auf Gewichte in den Modi Nr. 1 und Nr. 3 sowie auf Vorspannungen in allen Betriebsmodi angewendet wird. Im Gegensatz zu der Abweichung, die sich aus der Verwendung eines einzelnen Modulators für mehrere Kanäle ergibt und bis zu einem gewissen Grad kompensiert werden kann, kann dem vom AWG ausgehenden Übersprechen nicht einfach außerhalb des OLAU entgegengewirkt werden, da es musterabhängig ist und daher sowohl vom Index abhängt des Axons n und Index des Kanals m.

Nachdem das wellenlängenabhängige Verhalten der PPNN-Komponenten identifiziert wurde, kann seine experimentelle diagonale Transfermatrix \(Q_\mathrm {e}\) basierend auf der PPNN-Konfiguration für verschiedene Betriebsmodi gemäß den Tabellen 1 und 2 abgeleitet werden. Folgen Sie dem Signalverlauf in Abb. 1e und stützen Sie sich dabei auf Gl. (12) zur Modellierung der AWG-Reaktion und Gl. (5) und (8) für ungenäherte Eingabe- und Gewichtsmodulator-Übertragungsfunktionen. Ähnlich wie im Fall von \(Q_\mathrm {t}\) in Gl. (2a) ignorieren wir die akkumulierte Phasenverschiebung in \(Q_\mathrm {e}\) und beschränken unseren Fokus nur auf die Phasendifferenz zwischen dem Bias-Zweig und dem OLAU und zwischen den Axonen im OLAU selbst, da diese dazu führen mögliche Leistungsverschlechterung durch Beeinträchtigung der Interferenzbedingungen. Um eine Phasenausrichtung zwischen dem Bias-Zweig und dem OLAU in Betriebsmodi durchzuführen, die die Verwendung eines einzelnen Modulators zum Erzwingen von Eingaben oder Gewichten an mehrere Kanäle voraussetzen (Modus Nr. 3 für Eingaben und Nr. 2 für Gewichte), modifizieren wir die Übertragung des Bias-Zweigs Matrix von \({\widetilde{W}}_\mathrm {b}\) nach \({\widetilde{W}}_\mathrm {b} \Xi _c^{(w)}\) im Modus #2 oder \({\widetilde{W}}_\mathrm {b} \Xi _c^{(x)}\) im Modus #3, wobei

wobei \(\xi _{m,c}^{(x)}\) und \(\xi _{m,c}^{(w)}\) durch die Gleichungen definiert sind. (7b) bzw. (11b). Auf diese Weise kann eine kanalselektive Phasenakkumulation, die aus den Gl. (7a) und (11a) werden aufgehoben, wie in Abschnitt 8 des Zusatzdokuments beschrieben. Es sollte betont werden, dass \(Q_\mathrm {e}\) basierend auf den Gleichungen abgeleitet wurde. (7), (11) und (12) sind Näherungswerte und obwohl die Phasenkompensation über die PSs im Bias-Zweig erfolgt, bleibt eine gewisse Abweichung von \(Q_\mathrm {t}\) bestehen. In der kommenden Analyse werden diese durch den absoluten Fehler \(\Delta q_m = q_{\mathrm {e},m} - q_{\mathrm {t},m}\) und den relativen Fehler \(\delta) quantifiziert q_m = |\Delta q_m|/q_{\mathrm {t},m}\), zwischen dem experimentellen, \(q_{\mathrm {e},m}\) und dem gezielten, \(q_{\mathrm { t},m}\), diagonale Matrixelemente. Die Fehler können auf der Grundlage der Korrelationsausdrücke \(q_{\mathrm {e},m}\) und \(q_{\mathrm {t},m}\) in Abschnitt 8 des Zusatzdokuments abgeleitet werden.

Für unsere Fallstudie gehen wir von einer Siliziumplattform aus, wobei die Abhängigkeit des Brechungsindex von der Wellenlänge bei verschiedenen Temperaturen aus 30 stammt. Bei \(\lambda _c = 1,55 \, \mu \mathrm {m}\) und \(T_0 = 293 \, \mathrm {K}\) gilt \(n = 3,4757\) und \(n_\mathrm { g} = 3,5997\). Bei E/O-Modulatoren bleiben die optischen Eigenschaften des undotierten Siliziums (wo der Großteil des Lichts eingeschlossen ist) die gleichen wie oben, sofern die Dotierung nicht stark ist und/oder Verbundmaterialien verwendet werden Es wird davon ausgegangen, dass die Spannung für die interessierenden Spannungsbereiche annähernd linear ist.

Mit der Monte-Carlo-Methode beobachten wir \(10^4\) Mengen zufälliger, gleichmäßig verteilter Eingabe- und Gewichtswerte, ausgewählt im Bereich \(x_{n,m} \in [0,1]\) und \( w_{n,m} \in [-1,1]\) und halten Sie die Vorspannung fest auf \({\widetilde{w}}_{\mathrm {b},m} = 1\), um dies sicherzustellen Die Information über das Vorzeichen der Summe bleibt beim Übergang in den Potenzbereich erhalten. Beim Einsatz von PPNN in einer trainierten Umgebung kann die Bias-Gewichtung einen beliebigen Wert aus \({\widetilde{w}}_{\mathrm {b},m} \in [-1,1]\) annehmen, der durch den Trainingsalgorithmus vorgegeben wird. Im Anschluss an die Simulation werden die Diagonalmatrixelemente \(q_{\mathrm {t},m}\) und \(q_{\mathrm {e},m}\) aggregiert und 2D-Streudiagramme mithilfe eines multivariaten statistischen Ansatzes analysiert Abweichungen hinsichtlich absoluter und relativer Fehler zu ermitteln.

Vergleich zwischen dem Faltungsmodus (#2, linke Seite) und dem vollständig verbundenen Modus (#3, rechte Seite) des PPNN-Betriebs mit \(M=4\) Kanälen, optimiert für den Betrieb auf Kanal \( c=2\) und \(N=8\) Axone für \(\Delta \lambda _1 = 0.8 \, \mathrm {nm}\) und \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\). Kanalweise farbcodierte 2D-Streudiagramme des Zielmatrixelements \(q_{\mathrm {t},m}\) und (a), (b) die Größe und (c), (d) das Argument von das experimentelle Matrixelement \(|q_{\mathrm {e},m}|\) und (e), (f) die algebraische Größe der absoluten Abweichung des experimentellen vom angestrebten Matrixelement, \(\mathrm {Vorzeichen} ( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\), mit \(\Delta q_m = q_{\mathrm {e},m} - q_ {\mathrm {t},m}\), alle mit angezeigten univariaten Kernel-Wahrscheinlichkeitsdichtediagrammen auf den entsprechenden horizontalen und vertikalen Achsen der Streudiagramme.

Abbildung 4 zeigt 2D-Streudiagramme für zwei verschiedene Betriebsmodi, Faltung (linke Seite) und FC (rechte Seite), für den T/O-MZM-Vorspannungspunkt \(\theta = \pi /3\ ), normalisierte Längen \(p_x = q_x = 100\) und \(p_w = p_s = 50\), nominaler Kanalabstand \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\), übersetzt in ungefähr \ (100 \, \mathrm {GHz}\) im Frequenzbereich und \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\). Die Phasenausrichtung zwischen dem Bias-Zweig und dem OLAU-Ausgang wurde gemäß Gleichung durchgeführt. (13).

In Bezug auf die Größe des experimentellen Matrixelements \(|q_{\mathrm {e},m}|\) im Vergleich zum angestrebten Matrixelement \(q_{\mathrm {t},m}\), beide Modi des Betriebs zeigen eine ähnliche Leistung, wie durch Abb. 4a, b bestätigt, wenn sie für denselben Kanal, \(c = 2\), von \(M=4\) farbcodierten Kanälen im PPNN optimiert werden, wenn ein einzelner Modulator verwendet wird verwendet wird, oder für m optimiert, wenn ein Modulator pro Kanal verwendet wird. Der Rangkorrelationskoeffizient \(\rho\) nach Spearman übersteigt in beiden in Abb. 4a, b angegebenen Fällen 0,999 für alle 4 beobachteten Kanäle, was auf eine nahezu perfekte monotone Beziehung zwischen den beiden Größen hinweist. Die univariaten Wahrscheinlichkeitsdichtefunktionen (PDFs) von \(q_{\mathrm {t},m}\) und \(|q_{\mathrm {e},m}|\) behalten die Gaußsche Form und entsprechen dem zentralen Grenzwertsatz (CLT). Dennoch kann eine leichte Abwärtsverschiebung der Mittelwerte der Randkanal-PDFs beobachtet werden (\(m=1\) und \(m=4\)), oder mit anderen Worten, eine Verringerung des Mittelwerts des experimentellen Matrixelements im Vergleich zum Zielobjekt. Die Herunterschaltung impliziert, dass Randkanäle während der Ausbreitung durch PPNN einen größeren Leistungsverlust erleiden als die inneren Kanäle, was auf die DEMUX/MUX-Paare zurückzuführen ist, die die Modulatoren in den Eingangs- und Gewichtsbänken umfassen. Wenn nämlich der Randkanal demultiplext wird, wird der Bruchteil seiner optischen Leistung, der proportional zur Übersprechstärke (\(r_\mathrm {AWG}\)) ist, an einen benachbarten Kanal gesendet, der nicht von PPNN unterstützt wird (Kanal 0 für \ (m=1\) und Kanal \(M+1\) für \(m = M\)) gehen während des Demultiplexierungsschritts irreversibel verloren. Dieser Effekt wird bei inneren Kanälen nicht beobachtet, da sie ihre Übersprechsignale an die benachbarten Kanäle verteilen, die von PPNN unterstützt werden, und später von MUX gesammelt werden können, wie in Abschnitt 7 des Zusatzdokuments beschrieben. Dieser Randkanalverlustnachteil wird durch \(x_{n,0} = x_{n,M+1} = 0\) und \(w_{n,0} = w_{n,M+1} = 0 erfasst \) in Gl. (12) und sein Gegenstück für \(w_{n,m}^\mathrm {AWG}\).

Streudiagramme des Arguments von \(q_{\mathrm {e},m}\) gegenüber \(q_{\mathrm {t},m}\), dargestellt in Abb. 4c, d, zeigen die Phasenausrichtung basierend auf der durch die Gleichungen gegebene Näherungsausdruck. (7b) und (11b) liefern hervorragende Ergebnisse und bringen die Restphasenverschiebungen unter \(0,01\pi\,\mathrm{rad}\). Die Verteilung von \(\mathrm {arg}(q_{\mathrm {e},m})\) wird dank CLT durch Gauß gut angenähert und hängt in gewissem Maße vom angestrebten Matrixelement \(q_{\mathrm { t},m}\) Wert. Es ist auch zu erkennen, dass die Randkanäle (\(m=1\) und \(m=4\)) eine Verschiebung der PDFs erleiden, wie es bei den PDFs der Fall war, die den Betrag von \(q_{\mathrm { e},m}\), die aus nicht symmetrischen Phasenverschiebungen resultieren, die vom 1\(\mathrm{{st}}\)- und \(M\mathrm{{th}}\)-Kanal beobachtet werden. Diesmal hat die Verschiebung des Mittelwerts jedoch ein anderes Vorzeichen: positiv für den 1\(\mathrm{{st}}\) und negativ für den \(M\mathrm{{th}}\)-Kanal. In beiden Fällen ist die Verschiebung auf das Übersprechen im Bias-Zweig zurückzuführen, wo die Phasenkompensation durchgeführt wird. Betrachtet man das Bias-Gegenstück von (12), ist der Übersprechterm proportional zu \(r_\mathrm {AWG} ( {\widetilde{w}}_{\mathrm {b},m-1} - 2 {\widetilde{ w}}_{\mathrm {b},m} + {\widetilde{w}}_{\mathrm {b},m+1} )\), und mit \({\widetilde{w}}_ {\mathrm {b},m} = 1\) für alle unterstützten Kanäle \(m \in [1,M]\), sollte 0 betragen. Wenn jedoch \(m = 1\) oder \(m = M\) sind die Signale nicht ausgeglichen, da \({\widetilde{w}}_{\mathrm {b},0} = {\widetilde{w}}_{\mathrm {b},M+1} = 0\), so dass ein verbleibender Übersprechterm proportional zu \(-r_\mathrm {AWG}\) verbleibt, der mit \(\Xi _c^{(x)}\) oder \(\Xi _c^{(w) multipliziert wird )}\) abhängig von der Betriebsart, wie in Abschnitt 8 des Zusatzdokuments beschrieben. Andererseits hängen die Elemente von \(\Xi _c^{(x/w)}\) von der Differenz zwischen dem beobachteten Kanal m und dem Kanal ab, in Bezug auf den der Modulator zentriert war, c, wie (7b) und (11b) zeigen. Dies führt zu Phasenverschiebungen unterschiedlichen Vorzeichens für den 1\(\mathrm{{st}}\)- und den \(M\mathrm{{st}}\)-Kanal, da die typische Wahl \(c = \lceil M) ist /2 \rceil\). Unabhängig von der Mittelwertverschiebung bleiben die Standardabweichungen der entsprechenden quasi-Gaußschen PDFs ähnlich wie für die inneren Kanäle (\(m = 2\) und \(m = 3\)).

Schließlich beobachten wir in Abb. 4e, f die algebraische Größe des absoluten Fehlers zwischen den experimentellen und den angestrebten Transfermatrixelementen, \(\mathrm {sign}( {\mathfrak {R}}{\mathfrak {e}} \{ \Delta q_m \} ) |\Delta q_m|\). Der in Abb. 4a, b beobachtete Effekt der Mittelwertdrift für Randkanäle kann nun quantifiziert werden und bleibt für alle analysierten Fälle unter \(|\Delta q_m| < 0,06\), was den maximalen relativen Fehler in der Größenordnung von ergibt \(4 \%\) für Randkanäle. Bei inneren Kanälen ist der Fehler in der Nähe von 0 zentriert und bleibt für ein gegebenes \(\Delta \lambda _1\) und \(R_\mathrm {AWG}\) unter \(2 \%\) in \(> 90\%\) der analysierten Zufallsmengen.

Wir erweitern unsere Analyse auf alle Mehrkanalmodi des PPNN-Betriebs gemäß Tabelle 1 für \(\Delta \lambda _1\) von 0,4 bis \(1,6 \, \mathrm {nm}\) (umgerechnet auf einen Gitterabstand von 50–\( 200 \, \mathrm {GHz}\)) und \(R_\mathrm {AWG}\) von \(-\,40\) bis \(-\,5 \, \mathrm {dB}\), was berücksichtigt \(M=8\) Kanäle, zentriert bei \(c = 4\), wenn ein einzelner Modulator für alle Kanäle verwendet wird, und andernfalls bei m, mit dem Ziel, den Einfluss verschiedener Systemparameter auf den relativen Fehler des Matrixelements zu bestimmen, \(\delta q_m\). Abbildung 5 zeigt Mittelwerte der relativen Fehler über die Sammlung von \(10^4\) analysierten Proben, zusammen mit 5–95 %-Konfidenzgrenzen gegenüber \(\Delta \lambda _1\) für AWG-Übersprechen von \(-15 \, \mathrm {dB}\) und gegen \(R_\mathrm {AWG}\) für einen Kanalabstand von \(0,8 \, \mathrm {nm}\). Wie in den Streudiagrammen in Abb. 4 beobachtet, bestätigen wir anhand von Abb. 5 erneut, dass Kantenkanäle (\(m=1\) und \(m=8\)) ähnliche Fehlermengen verursachen (Linien überlappen). Dies ist größer als der Fehler, der bei inneren Kanälen (\(2 \le m \le 7\)) auftritt, die sich ebenfalls untereinander überlappen. Die zugrunde liegende Ursache hängt mit der Asymmetrie der Feldgrößen- und Phasenverschiebungen zusammen, die von Randkanälen beim Durchgang durch AWG akkumuliert werden, wie bereits erläutert. Die wichtige Schlussfolgerung, die sich aus dieser Überlappung ergibt, ist, dass die Anzahl der verwendeten Kanäle M für keinen der PPNN-Betriebsmodi eine Herausforderung darstellt, solange die Phasenkompensation innerhalb des Bias-Zweigs gemäß Gleichung (1) erfolgt. (13).

Mittlere relative Fehler des Matrixelements \(\delta q_m\) (angegeben in Prozent) mit \(5 \%\) bis \(95 \%\) Konfidenzgrenzen für (a), (b) Multineuron, ( c), (d) Faltung und (e), (f) FC-Betriebsart, abhängig von (a), (c), (e) Kanalabstand für \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\) und (b), (d), (f) AWG-Übersprechen für \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\).

Der Vergleich verschiedener Betriebsmodi in Abb. 5 zeigt, dass der mittlere relative Fehler, sei er höher für die Randkanäle oder niedriger für die inneren Kanäle, für verschiedene Betriebsmodi ziemlich ähnlich bleibt (mit Ausnahme sehr hoher \(R_\mathrm {AWG}) \)), mit schwächerer Abhängigkeit von \(\Delta \lambda _1\) als von \(R_\mathrm {AWG}\). Für \(R_\mathrm {AWG} = -15 \, \mathrm {dB}\) übersteigt es jedoch nicht \(4 \%\) für jedes analysierte \(\Delta \lambda _1\), jedoch nicht das Übersprechen steigt, schießt der mittlere Fehler exponentiell in die Höhe, übersteigt \(10 \%\) für die Randkanäle bei \(R_\mathrm {AWG} = -10 \, \mathrm {dB}\) und bleibt innerhalb beherrschbarer Werte von bis zu \(6\%\) für die inneren sogar bei \(R_\mathrm {AWG} = -5 \, \mathrm {dB}\). Andererseits gibt es einen signifikanten Unterschied im Konfidenzintervall zwischen den Betriebsmodi: Es ist am breitesten für den Multi-Neuron-Betriebsmodus (siehe Abb. 5a, b) und verringert sich für den Faltungs- und FC-Modus (siehe Abb. 5a, b). Abb. 5c – f, was bedeutet, dass im Fall mehrerer Neuronen große Fehler auftreten können, auch wenn dies nicht häufig vorkommt. Die gleiche Entwicklung des Konfidenzintervalls ist in Bezug auf AWG-Nebensprechen zu beobachten (Abb. 5b, d, f). Dies zeigt, dass mehr DE/MUX-Stufen im Modus Nr. 1 im Vergleich zu den verbleibenden beiden Betriebsmodi tatsächlich für die beträchtliche Streuung verantwortlich sind von Fehlern, wie es aufgrund der Gl. zu erwarten ist. (12).

Betrachtet man den Faltungsmodus (Abb. 5c, d) und den FC-Betriebsmodus (Abb. 5e, f), kann man Unterschiede in den Konfidenzintervallen und bis zu einem gewissen Grad im mittleren relativen Fehler für die inneren Kanäle beobachten, was auf diesen Faltungsmodus hinweist Betriebsdauer scheint insgesamt eine bessere Leistung zu erbringen. Doch aus architektonischer Sicht sind Abb. 1, 2 und 3 sind nahezu austauschbar. Gleichzeitig zeigt unsere Analyse, dass die normalisierten Modulatorlängen \(p_x\), \(q_x\), \(p_w\) und \(p_s\) erwartungsgemäß eine marginale Rolle bei den relativen Fehlermitteln und Konfidenzintervallen spielen unter Berücksichtigung der Tatsache, dass die akkumulierte Phase gemäß Gl. (7b) und (11b) wird durch die PSs innerhalb der Bias-Modulator-Bank gemäß Gl. kompensiert. (13). Der Unterschied entsteht somit als Reaktion auf unterschiedliche Bereiche von Eingaben und Gewichtungen, d. h. die Mengen, die gemeinsam für alle Kanäle durchgesetzt werden, und die Mengen, die auf Basis einzelner Kanäle durchgesetzt werden. Die Wiederholung der Analyse aus Abb. 5 für Gewichte, die auf denselben Bereich wie die Eingaben beschränkt sind, nämlich \(w_{n,m} \in [0,1]\), bestätigt, dass sich die Konfidenzintervalle für beide Betriebsarten leicht verringern und Noch wichtiger ist, dass sie in ihrer Größe ähnlich werden. Dies kann dadurch erklärt werden, dass die Größe des Übersprechens in der Gewichtsmodulatorbank im FC-Betriebsmodus reduziert wird, indem der Bereich der Werte, die \(w_{n, m \pm 1}\) annehmen kann, im Äquivalent von Gl. halbiert wird. (12) für \(w_{n,m}^\mathrm {AWG}\).

Relativer Fehler 5–95 % Konfidenzintervall (angegeben in %) gegenüber dem Neuronen-Fan-in N bei \(\Delta \lambda _1 = 0,8 \, \mathrm {nm}\) und \(R_\mathrm {AWG} = - 15 \, \mathrm {dB}\) für (a) Faltungs- und (b) vollständig verbundenen Modus.

Die Untersuchung der PPNN-Leistung beim Fan-In wurde für N im Bereich von 2 bis 64 durchgeführt und ist in Abb. 6 für Faltungs- und FC-Konfiguration dargestellt. Für beide Betriebsarten ist ein klarer Trend zu beobachten, bei dem sich das Konfidenzintervall mit zunehmendem N verringert, was auf die Verengung der univariaten PDF von sowohl \(q_{\mathrm {t},m}\) als auch \(|q_) zurückzuführen ist. {\mathrm {e},m}|\), gemäß CLT, wobei die Standardabweichung mit \(1/\sqrt{N}\) abnimmt. Die Werte des mittleren relativen Fehlers bleiben über verschiedene N-Werte hinweg denen in Abb. 5 ähnlich, was bedeutet, dass die Anzahl der Axone ähnlich wie bei anderen analysierten Parametern keine Herausforderung für den PPNN-Betrieb darstellt.

Hier diskutieren wir die praktischen Aspekte der PPNN-Implementierung und konzentrieren uns dabei auf Einfügungsverluste (\(\mathrm {IL}_\mathrm {PPNN}\)) und Stromverbrauch (\(P_{\mathrm {PPNN},m}\)). , Footprint (\(A_{\mathrm {PPNN},m}\)) und Durchsatz (\(T_{\mathrm {PPNN},m}\)), die gemeinsam die Energie- und Footprint-Effizienz prägen, definiert als Verhältnis des Durchsatzes und des Stromverbrauchs bzw. der PPNN-Fläche. Wir sind uns der Nachteile bewusst, die durch eine suboptimale Ressourcennutzung entstehen, wie z. B. das Abschalten einiger LDs oder das Dunkelhalten einiger Axone, d. h. die Verwendung von weniger Kanälen (\(M_A \le M\)) oder weniger Axonen (\(N_A). \le N\)) als das PPNN unterstützt. Basierend auf der detaillierten Studie, die in Abschnitt 9 des Zusatzdokuments beschrieben wird, ermitteln wir die jeweiligen Werte pro Anzahl aktiver Kanäle für Zweierpotenz-Aufteilungs- und Kombinationsstufen

wobei \(\mathrm {IL}_i\), \(L_i\) und \(P_i\) Einfügungsverluste, Länge und Stromverbrauch pro Gerät bezeichnen, mit Ausnahme von \(P_\mathrm {LD}\), die steht für die optische Leistung des LD pro Kanal. Indizes \(i\in \mathrm {\{MUX,S,C,X,W,R\}}\) beziehen sich in der angegebenen Reihenfolge auf DE/MUX, Schalter, X-Koppler, Eingangsamplitudenmodulator, Gewicht Amplituden- und Phasenmodulator und Routing-Wellenleiter. Darüber hinaus ist \(\eta _\mathrm {wp}\) die Steckdoseneffizienz des LD, \(L_\mathrm {A}\) ist die Gesamtlänge eines Axons, \(L_\Delta\) der Abstand zwischen seitlichen Wellenleitern ist \(B_\mathrm {X}\) die Datenrate des Eingangsmodulators und \(\mathrm {S}_\mathrm {\{X,W,O\}}\) die Schaltzustände abhängig von der Betriebsart in Tabelle 1 definiert.

Die ersten beiden Terme von \(\mathrm {IL}_\mathrm {PPNN}\) in (14a) bezeichnen den durch die Mehrkanaloperation eingeführten Nachteil (\(\sim \mathrm {IL}_\mathrm {MUX}\)) und Programmierbarkeit (\(\sim \mathrm {IL}_\mathrm {S}\)), wobei der letzte Begriff den Nachteil in Form einer irreversibel verlorenen optischen Leistung angibt, wenn \(N_A < N\) Axone verwendet werden. Bei Verwendung von \(M_A < M\)-Kanälen wird kein IL-Nachteil beobachtet.

Der PPNN-Stromverbrauch pro Kanal, gegeben durch (14b), wird durch alle seine aktiven Komponenten bestimmt, die wiederum basierend auf den Zuständen der Schalter und Betriebsmodi eingeschaltet werden. Der Stromverbrauch des optionalen Transimpedanzverstärkers (TIA) und Temperaturreglers (TEC) wird von der Analyse ausgeschlossen, da er unabhängig vom Mehrkanalbetrieb oder der PNN-Programmierbarkeit in ähnlicher Weise zum Gesamtstromverbrauch beitragen würde. Im Vergleich zu seinem Vorgänger, dem kohärenten linearen Dual-IQ-Neuron21, ist der Stromverbrauch von PPNN in den Modi Nr. 1 und Nr. 4 dem von Dual-IQ ähnlich, mit einem geringfügigen Nachteil \(\sim P_\mathrm {S}\) in PPNN Fall aufgrund seiner Programmierbarkeit. Der Betrieb im Modus Nr. 2 (Faltung) oder Nr. 3 (vollständig verbunden) führt jedoch im PPNN-Fall zu Energieeinsparungen durch die gemeinsame Nutzung des Gewichtungsmodulators (Nr. 2) oder des Eingangsmodulators (Nr. 3), da die Koeffizienten \(P_\mathrm { W}\) bzw. \(P_\mathrm {X}^\mathrm {(DC)/(RF)}\) werden durch die Anzahl der aktiven Kanäle \(M_A\) dividiert, was eine erhöhte Energieeffizienz impliziert des PPNN im Vergleich zur Verwendung von \(M_A\) Dual-IQ-Neuronen.

Wenn wir den PPNN-Footprint pro Kanal, gegeben durch (14c), mit dem von Dual-IQ vergleichen, können wir sowohl longitudinale als auch laterale Nachteile beobachten, ersterer aufgrund von DE/MUXes und Schaltern, die \(L_\mathrm {A}\) länger machen für PPNN als für Dual-IQ, und letzteres aufgrund der Existenz zweier alternativer Routen, die ein Signal innerhalb der Eingabe- und/oder Gewichtungsbänke nehmen kann. Konzentriert man sich auf zwei Eckszenarien, wenn (i) \(M_A = M \sim N\) und (ii) \(M_A = 1\), der seitliche Footprint-Nachteil aufgrund des Mehrkanalbetriebs und der Programmierbarkeit reicht von multiplikativen Faktoren von (i) \(\sim (1 + 2/N)\) (Best-Case-Szenario) bis (ii) \(M (1 + 1/N) + 1 - 1/N\) (Worst-Case-Szenario). Der zweite Fall zeigt, dass der stromsparende Betriebsmodus mit einem geringeren Platzbedarf verbunden ist, der proportional zur Anzahl der Kanäle ist, für die PPNN entwickelt wurde.

Die gründliche Untersuchung der Wellenlängenabhängigkeit einzelner Komponenten könnte weiter ausgeweitet werden, um den temperaturabhängigen Betrieb von Geräten und statistische Unterschiede zwischen den verwendeten Komponenten einzubeziehen. Der temperaturabhängige Betrieb würde nützliche Informationen über die Leistungszuverlässigkeit unter realistischen Bedingungen liefern, bei denen auf dem Chip Temperaturen von bis zu 80–100 \(^\circ\)C auftreten können. Eine erweiterte Analyse, bei der statistische Unterschiede zwischen den verwendeten Komponenten berücksichtigt werden, würde einen klareren Einblick in die praktischen Perspektiven liefern, da aktuelle Silizium-Photonik-Plattformen keine identische Leistung für identische Geräte garantieren und eine Systemtoleranzanalyse erfordern. Die Studie kann auch auf verschiedene Arten von Eingangs-/Gewichtungsmodulatoren ausgeweitet werden, die durch unterschiedliche Amplituden- und Phasengleichungen gesteuert werden, mit dem Ziel, analytische Ausdrücke für die Abweichungskompensation zu ermitteln.

Auf Systemebene können zwei Upscaling-Richtungen eingeschlagen werden. Eine davon bezieht sich auf die Verbindung mehrerer PPNNs und deren Einsatz in Inferenzaufgaben, um deren Genauigkeit unter einer nicht zufälligen Last abzuschätzen. Die zweite beruht auf den positiven Auswirkungen, die die Erhöhung der Anzahl der Axone auf die Verringerung des in Abb. 6 dargestellten Konfidenzintervalls des relativen Fehlers hat. Dies zeigt, dass die PPNN-Architektur zuverlässig in eine zweidimensionale Anordnung erweitert werden kann, ähnlich unserer Kürzlich wurde eine photonische Kreuzschiene31 vorgeschlagen, die K räumlich getrennte Neuronenausgänge liefert. Unterstützt durch WDM könnte Crossbar insgesamt \(K \times M\) logische Ausgänge unterstützen und gleichzeitig die Flexibilität bieten, zwischen den verschiedenen Betriebsmodi zu wechseln, was dem photonischen FPGA-Konzept nahe kommt.

In diesem Manuskript stellen wir ein in situ rekonfigurierbares kohärentes PNN vor, das den Wellenlängenbereich nutzt, um den parallelen Betrieb mehrerer Neuronen mit einem flexiblen, benutzerdefinierten Verbindungsgraphen zu erreichen und vier verschiedene Betriebsmodi unterstützt, darunter Faltungs- und vollständig verbundene Schichten. Wir führen eine detaillierte analytische Untersuchung der Modulator- und DE/MUX-Wellenlängenabhängigkeit durch und bieten einen einfachen Ansatz zur Wiederherstellung der PNN-Treue durch Phasenausrichtung des Vorspannungssignals. Dabei zeigen wir, dass der Großteil der Restfehler auf das Übersprechen im DE/MUX zurückzuführen ist Stufen. Der analytische Ansatz wird mit der Monte-Carlo-Simulation verglichen und zeigt, dass der verbleibende relative Fehler typischerweise innerhalb des überschaubaren 2 %-Bereichs für AWG-Übersprechen von bis zu \(-20 \, \mathrm {dB}\) bleibt. Noch wichtiger ist, dass sich die PNN-Leistung nicht mit zunehmender Anzahl von Kanälen oder dem Neuronen-Fan-in verschlechtert, solange die Phasenausrichtung im Bias-Zweig durchgeführt wird, was eine nahtlose Netzwerkskalierung unterstützt, einschließlich der Erweiterung auf mehrspaltige Anordnungen für Vektoren -Matrix-Multiplikation. Die relative Fehlerabhängigkeit vom Kanalabstand ist gering, sodass das PNN in groben und dichten WDM-Systemen gleich gut betrieben werden kann.

Die während der aktuellen Studie generierten und/oder analysierten Datensätze sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Kitayama, K.-I. et al. Neuartige Grenzen der Photonik für die Datenverarbeitung – Photonenbeschleuniger. APL Photonicshttps://doi.org/10.1063/1.5108912 (2019).

Artikel Google Scholar

De Marinis, L., Cococcioni, M., Castoldi, P. & Andriolli, N. Photonische neuronale Netze: Eine Umfrage. IEEE Access 7, 175827–175841. https://doi.org/10.1109/ACCESS.2019.2957245 (2019).

Artikel Google Scholar

Shastri, BJ et al. Photonik für künstliche Intelligenz und neuromorphes Computing. Nat. Photonik 15, 102–114. https://doi.org/10.1038/s41566-020-00754-y (2021).

Artikel ADS CAS Google Scholar

Feldmann, J. et al. Parallele Faltungsverarbeitung mit einem integrierten photonischen Tensorkern. Natur 589, 52–58. https://doi.org/10.1038/s41586-020-03070-1 (2021).

Artikel ADS CAS PubMed Google Scholar

Porte, X. et al. Ein vollständiges, paralleles und autonomes photonisches neuronales Netzwerk in einem Halbleiter-Multimode-Laser. J. Phys. Photonik. https://doi.org/10.1088/2515-7647/abf6bd (2021).

Artikel Google Scholar

Totović, AR, Dabos, G., Passalis, N., Tefas, A. & Pleros, N. Femtojoule pro MAC neuromorphe Photonik: Eine Energie- und Technologie-Roadmap. IEEE J. Sel. Spitze. Quantenelektron. 26, 1–15. https://doi.org/10.1109/JSTQE.2020.2975579 (2020).

Artikel Google Scholar

Nahmias, MA et al. Photonische Multiplikations-Akkumulations-Operationen für neuronale Netze. IEEE J. Sel. Spitze. Quantenelektron. 26, 1–18. https://doi.org/10.1109/JSTQE.2019.2941485 (2020).

Artikel Google Scholar

Miscuglio, M. & Sorger, VJ Photonische Tensorkerne für maschinelles Lernen. Appl. Physik. Rev.https://doi.org/10.1063/5.0001942 (2020).

Artikel Google Scholar

Zhang, H. et al. Ein optischer neuronaler Chip zur Implementierung eines komplexwertigen neuronalen Netzwerks. Nat. Komm. 12, 457. https://doi.org/10.1038/s41467-020-20719-7 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Shen, Y. et al. Deep Learning mit kohärenten nanophotonischen Schaltkreisen. Nat. Photonik 11, 441–446. https://doi.org/10.1038/nphoton.2017.93 (2017).

Artikel ADS CAS Google Scholar

Gu, J. et al. Jüngste Fortschritte bei Faltungs-Neuronalen Netzen. Mustererkennung. 77, 354–377. https://doi.org/10.1016/j.patcog.2017.10.013 (2018).

Artikel ADS Google Scholar

Leijnen, S. & Veen, FV Der neuronale Netzwerk-Zoo. Proceedingshttps://doi.org/10.3390/proceedings2020047009 (2020).

Artikel Google Scholar

Shawahna, A., Sait, SM & El-Maleh, A. FPGA-basierte Beschleuniger von Deep-Learning-Netzwerken für Lernen und Klassifizierung: Ein Überblick. IEEE Access 7, 7823–7859. https://doi.org/10.1109/ACCESS.2018.2890150 (2019).

Artikel Google Scholar

Bogaerts, W. et al. Programmierbare photonische Schaltkreise. Natur 586, 207–216. https://doi.org/10.1038/s41586-020-2764-0 (2020).

Artikel ADS CAS PubMed Google Scholar

Pai, S. et al. Parallele Programmierung eines beliebigen photonischen Feedforward-Netzwerks. IEEE J. Sel. Spitze. Quantenelektron. 26, 1–13. https://doi.org/10.1109/JSTQE.2020.2997849 (2020).

Artikel Google Scholar

Huang, C. et al. Auf dem Chip programmierbarer nichtlinearer optischer Signalprozessor und seine Anwendungen. IEEE J. Sel. Spitze. Quantenelektron. 27, 1–11. https://doi.org/10.1109/JSTQE.2020.2998073 (2021).

Artikel CAS Google Scholar

Bogaerts, W. & Rahim, A. Programmierbare Photonik: Eine Chance für ein zugängliches großvolumiges PIC-Ökosystem. IEEE J. Sel. Spitze. Quantenelektron. 26, 1–17. https://doi.org/10.1109/JSTQE.2020.2982980 (2020).

Artikel Google Scholar

Fard, MMP et al. Experimentelle Realisierung beliebiger Aktivierungsfunktionen für optische neuronale Netze. Opt. Express 28, 12138–12148. https://doi.org/10.1364/OE.391473 (2020).

Artikel ADS CAS Google Scholar

Crnjanski, J., Krstić, M., Totović, A., Pleros, N. & Gvozdić, D. Adaptive Sigmoid-ähnliche und PReLU-Aktivierungsfunktionen für rein optisches Perzeptron. Opt. Lette. 46, 2003–2006. https://doi.org/10.1364/OL.422930 (2021).

Artikel ADS PubMed Google Scholar

Xu, X. et al. 11 tops photonischer Faltungsbeschleuniger für optische neuronale Netze. Natur 589, 44–51. https://doi.org/10.1038/s41586-020-03063-0 (2021).

Artikel ADS CAS PubMed Google Scholar

Mourgias-Alexandris, G. et al. Neuromorphe Photonik mit kohärenten linearen Neuronen unter Verwendung von Dual-IQ-Modulationszellen. J. Lightwave Technol. 38, 811–819. https://doi.org/10.1109/JLT.2019.2949133 (2020).

Artikel ADS CAS Google Scholar

Mourgias-Alexandris, G. et al. Ein photonisch kohärentes Siliziumneuron mit einer Verarbeitungszeilenrate von 10 GMAC/Sek. In Proc. Optical Fiber Communication Conference (OFC) 2021., Tu5H.1 (Virtuelle Konferenz, 2021).

Giamougiannis, G. et al. Siliziumintegrierte kohärente Neuronen mit 32 GMAC/Sek./Axon berechnen Zeilenraten mithilfe von EAM-basierten Eingabe- und Gewichtungszellen. In Proc. Europäische Konferenz für optische Kommunikation (ECOC) 2021. (Bordeaux, Frankreich, 2021).

Passalis, N. et al. Training rauschresistenter rekurrenter photonischer Netzwerke für die Analyse finanzieller Zeitreihen. Im Jahr 2020 28. Europäische Signalverarbeitungskonferenz (EUSIPCO), 1556–1560, https://doi.org/10.23919/Eusipco47968.2020.9287649 (2021).

Pitris, S. et al. 400-Gbit/s-Silizium-Photonensender und Routing-WDM-Technologien für leimlose 8-Sockel-Chip-zu-Chip-Verbindungen. J. Lightwave Technol. 38, 3366–3375. https://doi.org/10.1109/JLT.2020.2977369 (2020).

Artikel ADS CAS Google Scholar

Gilardi, G. et al. Tiefe Gräben zur Reduzierung des thermischen Übersprechens in InP-basierten photonischen integrierten Schaltkreisen. J. Lightwave Technol. 32, 4864–4870. https://doi.org/10.1109/JLT.2014.2366781 (2014).

Artikel CAS Google Scholar

Krochin-Yepez, P.-A., Scholz, U. & Zimmermann, A. Cmos-kompatible Maßnahmen für das Wärmemanagement phasenempfindlicher photonischer Siliziumsysteme. Photonikhttps://doi.org/10.3390/photonics7010006 (2020).

Artikel Google Scholar

Milanizadeh, M., Aguiar, D., Melloni, A. & Morichetti, F. Aufhebung thermischer Übersprecheffekte in photonischen integrierten Schaltkreisen. J. Lightwave Technol. 37, 1325–1332. https://doi.org/10.1109/JLT.2019.2892512 (2019).

Artikel ADS CAS Google Scholar

Takahashi, H., Oda, K., Toba, H. & Inoue, Y. Übertragungseigenschaften eines N × N-Wellenlängenmultiplexers mit angeordneten Wellenleitern. J. Lightwave Technol. 13, 447–455. https://doi.org/10.1109/50.372441 (1995).

Artikel ADS Google Scholar

Li, HH Brechungsindex von Silizium und Germanium und seine Wellenlängen- und Temperaturableitungen. J. Phys. Chem. Ref. Daten 9, 561–658. https://doi.org/10.1063/1.555624 (1980).

Artikel ADS CAS Google Scholar

Giamougiannis, G. et al. Kohärenter photonischer Kreuzbalken als universeller linearer Operator. Rezensionen zu Laser und Photonik (2021). Zur Veröffentlichung eingereicht.

Referenzen herunterladen

Diese Forschungsarbeit wurde teilweise von der Hellenic Foundation for Research and Innovation (HFRI) im Rahmen der „Ersten Ausschreibung für HFRI-Forschungsprojekte zur Unterstützung von Fakultätsmitgliedern und Forschern und der Beschaffung von Zuschüssen für kostenintensive Forschungsausrüstung“ (DeepLight, Projektnummer: 4233) unterstützt ).

Fakultät für Informatik, Zentrum für interdisziplinäre Forschung und Innovation – CIRI, Aristoteles-Universität Thessaloniki, Balkan Center – Gebäude A, 10. Km Thessalonikis-Thermis Av, 57001, Thessaloniki, Griechenland

Angelina Totovic, George Giamougiannis, Apostolos Tsakyridis und Nikos Pleros

Celestial AI, 3001 Tasman Drive, Santa Clara, CA, 95054, USA

David Lazovsky

Sie können diesen Autor auch in PubMed Google Scholar suchen

Alle Autoren haben die Idee konzipiert und den Arbeitsablauf entworfen. AT führte die mathematische Analyse durch und GG und AT stellten den Code für die Leistungsanalyse bereit. Alle Autoren trugen zur Analyse der Ergebnisse bei und waren Mitautoren der Arbeit.

Korrespondenz mit Angelina Totovic.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Totovic, A., Giamougiannis, G., Tsakyridis, A. et al. Programmierbare photonische neuronale Netze, die WDM mit kohärenter linearer Optik kombinieren. Sci Rep 12, 5605 (2022). https://doi.org/10.1038/s41598-022-09370-y

Zitat herunterladen

Eingegangen: 22. September 2021

Angenommen: 22. März 2022

Veröffentlicht: 04. April 2022

DOI: https://doi.org/10.1038/s41598-022-09370-y

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

ProLabs‘ O

Außen mm

Blog

Programmierbare photonische neuronale Netze, die WDM mit kohärenter linearer Optik kombinieren