Ostatnie osiągnięcie firmy Meta w dziedzinie sztucznej inteligencji może zasadniczo zmienić sposób, w jaki maszyny uczą się. Opracowany wspólnie przez Meta FAIR i Narodowy Uniwersytet Singapuru, framework SPICE umożliwia systemom AI samodzielne nauczanie się złożonego rozumowania bez jakiejkolwiek ludzkiej nadzoru, zbliżając nas do prawdziwie autonomicznych inteligentnych systemów.
Jak dwa agentów AI rywalizują, aby stać się mądrzejszymi
Tradycyjne szkolenie AI wymaga ogromnych zbiorów danych oznakowanych przez ludzi oraz ciągłego doskonalenia przez inżynierów. SPICE (Self-Play for Iterative Capability Enhancement) podchodzi do tego w radykalnie inny sposób: wystawia dwa agentów AI przeciwko sobie w nieskończonej grze edukacyjnej.
Jeden agent tworzy trudne problemy, podczas gdy drugi stara się je rozwiązać. Gdy rozwiązującemu się to uda, twórca problemów projektuje trudniejsze zagadki. Ta konkurencyjna dynamika tworzy samowystarczalny cykl ulepszeń – bez potrzeby interwencji ludzkiej. Framework opiera się na zasadach uczenia się przez wzmacnianie, ale dodaje kluczowy zwrot akcji: AI aktywnie generuje własny program nauczania, identyfikując luki w wiedzy i projektując ćwiczenia, aby je zapełnić.
Dlaczego to ma znaczenie dla przyszłości AI
Obecne systemy AI doskonale radzą sobie z konkretnymi zadaniami, ale mają problemy z adaptacją. SPICE radzi sobie z tym, promując ogólne zdolności rozumowania, które można przenieść na różne dziedziny. Badacze z Meta FAIR zademonstrowali to na zadaniach związanych z rozumowaniem matematycznym, gdzie modele szkolone za pomocą SPICE przewyższyły systemy nadzorowane w tradycyjny sposób, szczególnie w przypadku nowych problemów.
Potencjalne zastosowania obejmują liczne dziedziny. W robotyce SPICE może umożliwić maszynom adaptację do nieznanych środowisk bez konieczności przeprogramowania. W badaniach naukowych może generować nowe hipotezy i projekty eksperymentalne. Niezależnie od tego, czy SPICE stanie się fundamentem dla systemów AI nowej generacji, czy pozostanie jednym z wielu eksperymentów, pokazuje, że samodoskonaląca się AI przestaje być naukową fikcją, a staje się inżynierską rzeczywistością.
—
Źródła:
1. VentureBeat – „Framework SPICE firmy Meta pozwala systemom AI uczyć się samodzielnie rozumowania” – https://venturebeat.com/ai/metas-spice-framework-lets-ai-systems-teach-themselves-to-reason
2. Oficjalne publikacje badawcze Meta FAIR – https://ai.meta.com/research/
3. Badania AI Narodowego Uniwersytetu Singapuru – https://www.comp.nus.edu.sg/
4. Podstawy uczenia się przez wzmacnianie – „Reinforcement Learning: An Introduction” autorstwa Sutton & Barto
5. Blog Meta AI o uczeniu się z nadzorem własnym – https://ai.meta.com/blog/
