Neuronové sítě selhaly ve středoškolském testu matematiky

Výzkum a věda | |

Neuronové sítě selhaly ve středoškolském testu matematiky

Britská společnost DeepMind, která se zaměřuje na vývoj umělé inteligence a v současnosti spadá pod doménu Alphabetu – tedy Googlu – sestavila dvě různé AI, která měly zvládnout vypočítat běžný středoškolský test matematiky. Neprospěly zrovna s vyznamenáním.


Neuronové sítě hlubokého učení mají širokou škálu užití, ale středoškolské testy matematiky mezi nimi očividně nefigurují. 1+1+1+1+1+1+1 je totiž podle nich 6. Základní aritmetické výpočty se umělé inteligenci příliš nedařily.

Ono důvod je prostý – neuronové sítě zkrátka nejsou na podobné výpočty stavěny, slouží k jiným účelům; i se základní matematikou mají v současné době problém. Neuronové sítě od DeepMind správně odpověděly na pouhých 14 otázek ze 40 z daného testu.

Studie Analysing Mathematical Reasoning Abilities of Neural Models“ vznikla za účelem založení vzorového testu, dle kterého mohou další vývojáři měřit výsledky v matematických dovednostech dalších neuronových sítí; staví tak na podobném principu jako ImageNet pro rozpoznávání obrazu.

Studie je, jak už je dnes u AI studií obvykle, dostupná na ArXivu.

Modely vědci trénovali na základě otázek a odpovědí, nikoli implementací matematických dovedností. Otázka v podobě výpočtu a číselná odpověď měla sloužit k vytvoření takových AI, které budou obecné a měly by matematické dovednosti ovládat – nikoliv vyvinutí přímo matematicky zaměřených modelů.

Dva odlišné druhy neuronových sítí, jedna typu LSTM a druhá typu Transformer (poměrně nový typ neuronové sítě vytvořený inženýry Googlu).

Oba modely měly ve finále odlišné výsledky, ale zrovna ideální nebyly ani u jednoho typu. Je zajímavé, že lépe se sítím dařilo v případě, kdy musely počítat s velkými čísly a bylo jich vícero najednou. Jednoduché výpočty s málo čísly byly naopak pro neuronové sítě velmi obtížné.

Vědci sami přesně nevědí, proč tomu tak je.


Úvodní foto: @ Laurent - Fotolia.com


Články z rubriky

Deepfake geografie: Zfalšované satelitní snímky hrozí budoucími problémy"

Oheň v Central Parku nebo ohňostroj v Indii během Diwali viditelný z vesmíru – i to lze spatřit na speciálně upravených satelitních snímcích, které odborníci označují za „deepfake geografii“.
více »


Rychlejší reakce na budoucí pandemie"

To, že může kdykoliv udeřit další globální pandemie, se vědělo už před Covidem – ač se taková možnost značně podceňovala. Na příště už chce být svět připraven lépe.
více »


Boltzmannův stroj pro kvantové strojové učení"

Kvantové počítače splní svůj příslib vysoké efektivity a sice omezené, nicméně nepřekonatelné rychlosti, pouze pokud pro ně budou existovat funkční algoritmy.
více »


Inspirace hmyzem pomáhá zlepšit drony"

Komáři, sršni i mouchy mají jedinečné způsoby letu, které lze uplatnit i v případě malých dronů. Jejich aerodynamika a principy vznášení můžeme uplatnit ve světě technologií.
více »


Kvantový průlom? Jsme na cestě ke skutečným kvantovým počítačům"

Vědcům z Chicagské univerzity se poprvé v historii povedlo propojit dvě oddělené skupiny qubitů do kvantového provázání skrze kabel. Jde o jedinečný průlom, který by měl zrychlit tvorbu kvantových sítí.
více »


Související články


Tagy

AI umělá inteligence neuronové sítě matematika výpočty vzdělávání školství studie věda výzkum Google DeepMind

Komentáře