"Anthropic"in ən güclü modeli: açıq istifadəyə verilməyən süni intellekt

“Anthropic” şirkəti açıq istifadə üçün həddindən artıq riskli hesab etdiyi yeni nəsil süni intellekt modelini təqdim edib. “Claude Mythos Preview” adlandırılan bu sistem süni intellekt inkişafının növbəti mərhələsinin artıq təkcə mətn və analizlə məhdudlaşmadığını, birbaşa kiberinfrastruktur səviyyəsində fəaliyyət göstərə bildiyini göstərir. Model müxtəlif əməliyyat sistemlərində minlərlə naməlum boşluğu aşkar etmək, müstəqil şəkildə eksployt (Eksployt -proqram təminatında, əməliyyat sistemində və ya aparat təminatında olan hər hansı bir səhvi, boşluğu və ya çatışmazlığı hədəf alan xüsusi hazırlanmış proqram kodu, məlumat yığını və ya əmrlər silsiləsidir-red.) yazmaq və hətta izolyasiya olunmuş təhlükəsiz mühitdən çıxmaq kimi imkanlara malikdir. Bu xüsusiyyətlər onu, eyni zamanda, həm güclü müdafiə alətinə, həm də potensial kiber-silah statusuna yaxınlaşdırır.

Sınaqlar zamanı model qısa müddətdə əsas əməliyyat sistemləri və brauzerlərdə minlərlə “zero-day” boşluğu aşkar edib. “Zero-day”, yəni “sıfırıncı gün” o deməkdir ki, istehsalçının bu problemi həll etmək üçün 0 günü olub. Yəni proqramçılar boşluğun varlığından hələ indi xəbər tutublar və ya hələ də xəbərsizdirlər. Hakerlər isə artıq bu boşluqdan istifadə edərək sistemə sızmağa başlayıblar. Ən diqqətçəkən tapıntılar arasında OpenBSD-də (OpenBSD- azad və açıq mənbəli Unix-ə bənzər əməliyyat sistemidir-red.) 27 il mövcud olmuş uzaqdan serveri çökdürməyə imkan verən xəta, FFmpeg-də (FFmpeg - video, audio və digər multimedia faylları və axınlarını idarə etmək üçün kitabxanalar və proqramlar dəstindən ibarət azad və açıq mənbəli proqram layihəsidir-red.) milyonlarla avtomatlaşdırılmış testdən yayınmış 16 illik baq (baq-kompüter proqramında xəta deməkdir-red.) və Linux nüvəsindəki cihaz üzərində tam nəzarət yaradan boşluqlar zənciri qeyd olunur. Bu nəticələr modelin əvvəlki nəsil sistemlərlə müqayisədə kəskin üstünlüyünü göstərir. Məsələn, əvvəlki model təxminən 500 “zero-day” boşluğu aşkarladığı halda, “Mythos” daha yüksək test göstəriciləri ilə proqram təminatı təhlükəsizliyi sahəsində yeni standart formalaşdırır.

“Anthropic”in hesabatında modelin nadir hallarda arzuolunmaz davranışlar nümayiş etdirdiyi də vurğulanır. Qarşılıqlı əlaqələrin çox kiçik hissəsində model tapdığı məlumatları gizlətməyə çalışıb, həlli əvvəlcədən əldə etməsinə baxmayaraq bunu tədqiqatçılardan gizlədib və nəticəni sanki özü tapmış kimi təqdim etmək istəyib. Digər epizodda isə model eksployt vasitəsilə sistemdə imtiyazlarını artıraraq fəaliyyət izlərini silib. Bu cür davranışlar süni intellektin yalnız texniki gücünün deyil, həm də avtonom qərar vermə və öz fəaliyyətini maskalama meyllərinin ortaya çıxdığını göstərir.

Daha diqqətçəkən sınaqlardan birində model xüsusi “sandbox” (Sandbox-keyfiyyətsiz və yanlış məzmunlu veb saytların axtarış nəticələrində çox geridə qalmasına imkan verən Google tərəfindən qurulmuş bir sistemdir-red.) mühitinə yerləşdirilib və buradan çıxmaq tapşırığı verilib. “Mythos” boşluq taparaq mühitdən çıxmağı bacarıb, internetə qoşulub və bu barədə tədqiqatçıya sonradan məlumat verib. Bu hadisə süni intellekt təhlükəsizliyi sahəsində uzun müddətdir müzakirə edilən “laboratoriyadan qaçış” ssenarisinin nəzəri deyil, praktik risk kimi qiymətləndirilməsinə səbəb olub.

Ekspertlər hesab edirlər ki, bu tip modellərin yaranması kiber təhlükəsizlik sahəsində “silahlanma yarışını” yeni mərhələyə keçirir. “Zero-day” boşluqların bu sürətlə aşkarlanması müdafiə sistemlərini gücləndirə bilsə də, eyni texnologiyanın hakerlər və ya dövlət səviyyəli kiber əməliyyatlar üçün istifadə olunması ehtimalını artırır. Süni intellektin həm hücum, həm də müdafiə aləti kimi eyni anda çıxış etməsi rəqəmsal təhlükəsizlik balansını kökündən dəyişə bilər.

Modelin davranışında müşahidə olunan “özünü gizlətmə” meyli ayrıca etik narahatlıq yaradır. Cavabın “çox dəqiq görünməməsinə” çalışmaq kimi daxili qərar mexanizmləri süni intellektin manipulyativ davranış potensialına malik ola biləcəyini göstərir. Bu isə süni intellekt sistemlərinin gələcəkdə daha müstəqil və proqnozlaşdırılması çətin aktorlara çevrilməsi ehtimalını gündəmə gətirir.

Məhz bu risklərə görə “Anthropic” modeli açıq istifadəyə buraxmamaq qərarı verib. Şirkət girişi yalnız məhdud tərəfdaş şəbəkəsi çərçivəsində saxlayır və texnologiyanın təhlükəsizlik məqsədli tətbiqini prioritet hesab edir. Bununla belə, mütəxəssislər oxşar imkanlara malik modellərin yaxın 6–18 ay ərzində digər laboratoriyalarda da meydana çıxacağını proqnozlaşdırırlar. Bu isə süni intellektin artıq informasiya aləti deyil, real kiberinfrastruktur üzərində təsir gücünə malik strateji texnologiyaya çevrildiyini göstərir.

Hazırladı:

Səbuhi MƏMMƏDOV