banner

Nachricht

Mar 23, 2024

Licht

Die Fähigkeit von ChatGPT, als Antwort auf ein paar einfache Anfragen ausgefeilte Aufsätze, E-Mails und Code zu erstellen, hat internationale Aufmerksamkeit erregt. Forscher am MIT haben über eine Methode berichtet, die das Potenzial hat, den Weg für Programme für maschinelles Lernen zu ebnen, die um ein Vielfaches leistungsfähiger sind als das für ChatGPT verantwortliche. Darüber hinaus verbraucht ihre Technologie möglicherweise weniger Energie als die hochmodernen Supercomputer, die die heutigen Modelle des maschinellen Lernens antreiben.

Das Team berichtet über die erste experimentelle Demonstration des neuen Systems, das Hunderte von Lasern im Mikrometerbereich verwendet, um Berechnungen durchzuführen, die auf der Bewegung von Licht und nicht auf Elektronen basieren. Das neue System ist mehr als 100-mal energieeffizienter als aktuelle digitale Computer auf dem neuesten Stand der Technik für maschinelles Lernen und 25-mal leistungsfähiger in der Rechendichte.

Darüber hinaus stellen sie „wesentlich noch mehrere Größenordnungen für künftige Verbesserungen“ fest. Dies, so fügen die Wissenschaftler hinzu, „eröffnet den Weg zu groß angelegten optoelektronischen Prozessoren, um maschinelle Lernaufgaben von Rechenzentren bis hin zu dezentralen Edge-Geräten zu beschleunigen.“ In Zukunft könnten kleine Geräte wie Mobiltelefone in der Lage sein, Programme auszuführen, die nur in riesigen Rechenzentren berechnet werden können.

Massive Modelle des maschinellen Lernens, die die Informationsverarbeitung des Gehirns nachahmen, bilden die Grundlage für tiefe neuronale Netze (DNNs), wie das, das ChatGPT antreibt. Während das maschinelle Lernen zunimmt, stagnieren die digitalen Technologien, die den heutigen DNNs zugrunde liegen. Zudem sind sie aufgrund ihres extremen Energiebedarfs oft nur in sehr großen Rechenzentren zu finden. Dies treibt Innovationen in der Computerarchitektur voran.

Die Disziplin der Datenwissenschaft entwickelt sich aufgrund des Aufkommens tiefer neuronaler Netze (DNNs) weiter. Als Reaktion auf die exponentielle Ausweitung dieser DNNs, die die Fähigkeiten herkömmlicher Computerhardware beansprucht, wurden in letzter Zeit optische neuronale Netze (ONNs) entwickelt, um DNN-Aufgaben mit hohen Taktraten parallel und mit minimalem Datenverlust auszuführen. Eine geringe elektrooptische Umwandlungseffizienz, große Geräteflächen und Kanalübersprechen tragen zu einer geringen Rechendichte in ONNs bei, während ein Mangel an Inline-Nichtlinearität zu erheblichen Verzögerungen führt. Forscher haben experimentell gezeigt, dass ein räumlich-zeitlich gemultiplextes ONN-System alle diese Probleme gleichzeitig lösen kann. Sie nutzen die Neuronenkodierung mithilfe mikrometergroßer Arrays von oberflächenemittierenden Lasern mit vertikaler Kavität (VCSELs), die in großen Mengen hergestellt werden und eine hervorragende elektrooptische Umwandlung aufweisen.

Zum ersten Mal stellen Forscher einen kleinen Entwurf vor, der diese drei Probleme gleichzeitig angeht. Moderne LiDAR-Fernerkundung und Laserdruck nutzen beide diese Architektur, die auf Arrays vertikaler oberflächenemittierender Laser (VCSELs) basiert. Diese Maßnahmen scheinen in naher Zukunft eine Verbesserung um zwei Größenordnungen zu bewirken. Der optoelektronische Prozessor bietet neue Möglichkeiten zur Beschleunigung maschineller Lernprozesse in zentralisierten und verteilten Infrastrukturen.

Besuche diePapierUndBlog . Alle Anerkennung für diese Forschung gebührt den Forschern dieses Projekts. Vergessen Sie auch nicht, mitzumachenunser 27k+ ML SubReddit,Discord-Kanal, UndE-Mail-Newsletter, wo wir die neuesten Nachrichten aus der KI-Forschung, coole KI-Projekte und mehr teilen.

Dhanshree Shenwai ist Informatikingenieur und verfügt über gute Erfahrung in FinTech-Unternehmen in den Bereichen Finanzen, Karten & Zahlungen und Bankwesen mit großem Interesse an Anwendungen von KI. Sie ist begeistert davon, neue Technologien und Fortschritte in der sich entwickelnden Welt von heute zu erforschen, um das Leben aller einfacher zu machen.

PapierBlogunser 27k+ ML SubRedditDiscord-KanalE-Mail-Newsletter
AKTIE