Szukaj...
Ctrl + K

Układ AI do obsługi nieliniowych obliczeń matematycznych

Zamiast przetwarzać dane zarejestrowane przez fotony, dlaczego nie wykorzystać ich bezpośrednio do obliczeń?

13-01-2025 21:11
światłowód
Źródło: uxu

Typowa kamera cyfrowa używana w pojazdach, np. w systemach awaryjnego hamowania, potrzebuje ponad 20 milisekund na przekształcenie fotonów wpadających przez jej obiektyw w sygnały elektryczne za pomocą technologii CMOS lub CCD. To nie obejmuje czasu wymaganego na przesłanie danych do komputera pokładowego i ich przetworzenie.

Zespół badaczy z MIT zaproponował jednak rozwiązanie, w którym układ scalony może przetwarzać fotony bezpośrednio. W ten sposób omija się konieczność digitalizacji, co potencjalnie pozwala na osiągnięcie zdumiewających prędkości obliczeniowych.

“Naszym priorytetem jest redukcja opóźnień. Skupiamy się na aplikacjach, w których najważniejszy jest czas uzyskania wyniku. Dlatego badamy systemy zdolne do całkowicie optycznych obliczeń,” tłumaczy Saumil Bandyopadhyay z MIT. Zespół opracował kompletną sieć neuronową na fotonicznym chipie, osiągając czas opóźnienia rzędu 410 pikosekund. Dla porównania, taki chip mógłby przetworzyć całą swoją sieć neuronową 58 razy w ciągu jednego cyklu zegara CPU pracującego z częstotliwością 4 GHz.

Matryce i nieliniowość

Sieci neuronowe operują na warstwach jednostek obliczeniowych, które działają jak neurony. Każdy neuron przyjmuje dane wejściowe, np. liczby, które są następnie mnożone przez stałe zwane wagami lub parametrami i przekazywane dalej. Proces ten odpowiada operacjom algebry liniowej, takim jak mnożenie macierzy.

Jednak zastosowanie AI wymaga również nieliniowych funkcji progowych, które pozwalają dostosować wagi między warstwami neuronów. To właśnie ta kombinacja operacji liniowych i nieliniowych pozwala sieciom neuronowym na mapowanie złożonych zależności w danych. Problem polega na tym, że kaskadowe przetwarzanie tych operacji wymaga ogromnych zasobów obliczeniowych i energii.

Zespół Bandyopadhyay’a uważa, że te operacje można wykonywać przy użyciu fotonów zamiast elektronów. Informacje na fotonicznych układach scalonych mogą być kodowane w takich właściwościach jak polaryzacja, faza czy częstotliwość światła. Chociaż perspektywa ta jest niezwykle obiecująca, budowa takich chipów pozostaje wyzwaniem.

Przełamywanie barier technologicznych

“Fotony świetnie sprawdzają się w operacjach macierzowych,” wyjaśnia Bandyopadhyay. Już w 2017 roku zespół z MIT pod kierownictwem Dirka Englunda zaprezentował fotoniczny chip wykonujący mnożenie macierzy z wykorzystaniem światła. Problemem pozostawała jednak implementacja funkcji nieliniowych w tej technologii.

Dotychczasowe podejścia polegały na realizowaniu operacji liniowych na chipach fotonicznych, a nieliniowe funkcje były przenoszone na układy elektroniczne. Taki proces zwiększał jednak opóźnienia, ponieważ wymagał wielokrotnego konwertowania informacji między światłem a sygnałami elektrycznymi.

Zespół Bandyopadhyay’a stworzył chip zdolny do przeprowadzania zarówno operacji liniowych, jak i nieliniowych w pełni optycznie. Proces rozpoczyna się od lasera zewnętrznego z modulatorem, który przekształca sygnały elektryczne na światło. Następnie światło rozdziela się na sześć kanałów, gdzie przeprowadza się mnożenie macierzy za pomocą interferometrów Mach-Zehndera.

Każdy interferometr działa jak programowalny dzielnik wiązki, mieszając dwa pola optyczne i generując dwa wyjściowe pola. Sterując napięciem, można kontrolować, jak bardzo pola te się mieszają, realizując operacje macierzowe w pełni optycznie.

Przyszłość fotonicznych układów AI

Cały chip miał trzy warstwy neuronów przeprowadzające operacje macierzowe i dwie jednostki nieliniowe między nimi. Obecnie układ obsługuje 132 parametry, co jest dalekie od możliwości modeli takich jak ChatGPT-4, który działa na bilionach parametrów.

Jednak Bandyopadhyay podkreśla, że celem jego zespołu jest opracowanie układów do mniejszych modeli wymagających niskiego opóźnienia, np. w systemach autonomicznych pojazdów. Fotoniczne chipy mogą pozwolić na błyskawiczną klasyfikację danych z lidarów bez potrzeby ich konwersji na sygnały elektryczne.

W przyszłości fotoniczne układy mogą zastąpić tradycyjne kamery, pozwalając na bezpośrednie przetwarzanie optycznych danych wejściowych. “To tylko kwestia dopracowania systemu,” twierdzi Bandyopadhyay. Dzięki wykorzystaniu standardowych procesów CMOS, skalowanie tej technologii jest bardziej osiągalne niż kiedykolwiek wcześniej.