lt

lt

Praėjusios savaitės DI naujienos #22

DI didina darbo krūvius nepaisant produktyvumo augimo, Muskas pristato Lunar DI planus, „Google“ ir „OpenAI“ pasiekia naujus rekordus, o „Anthropic“ susiduria su įtampa Pentagone. Štai kas įvyko DI srityje praėjusią savaitę.

LT

2/17/20266 min skaitymo

Nuo Lunar DI gamyklų planų ir rekordinių rezultatų testuose ir saugumo režimų ir įtampos su Pentagonu, rinka juda keliomis kryptimis vienu metu. Produktyvumas auga, darbo krūviai plečiasi, modeliai tampa išmanesni, greitesni ir savarankiškesni, o rizikos ir galimybės tik didėja.

Trumpa apžvalga:

DI didina darbo krūvį net ir didindamas produktyvumą
Muskas pristato xAI mėnulio planus ir naują komandų struktūrą
Z[.]ai pristatė GLM-5, Kinijos artėjančią DI lyderę
Anthropic įspėja: Claude Opus 4.6 gali būti piktnaudžiavimo objektu
Google Gemini 3 Deep Think pasiekė naujus rekordus testuose
OpenAI pristatė GPT-5.3-Codex-Spark, ultragreitas programavimas
GPT-5.2 padarė pirmą DI originalų atradimą teorinėje fizikoje
Pentagonas svarsto Anthropic pripažinti kaip tiekimo grandinės rizika
OpenAI pristatė „ChatGPT“ saugumo režimą „Lockdown Mode“
Visa kita, kas vyko DI srityje per praėjusią savaitę

DI DIDINA DARBO KRŪVĮ NET IR DIDINDAMAS PRODUKTYVUMĄ

Harvardo verslo apžvalgos tyrimas parodė, kad JAV technologijų įmonėje dirbantys darbuotojai naudodami dirbtinį intelektą (DI) per 8 mėnesius ne sumažino darbo krūvio, bet priešingai, ėmėsi platesnių užduočių, dirba ilgiau ir dažniau atlieka kelias užduotis vienu metu. Tyrime dalyvavo ~200 savarankiškai DI naudojančių darbuotojų ir buvo atlikta 40+ išsamių interviu. DI padėjo atlikti naujas užduotis, bet suliejo darbo ir poilsio ribas bei padidino kolegų konsultavimo poreikį.

Kodėl tai svarbu verslams?

Nors DI didina produktyvumą, jis gali netyčia išplėsti darbuotojų vaidmenis, juos pervarginti ir greičiau nei tikimasi pakeisti darbo procesus, tai kelia pavojų darbuotojų gerovei, išlaikymui ir komandų efektyvumui.

MUSKAS PRISTATO XAI MĖNULIO PLANUS IR NAUJĄ KOMANDŲ STRUKTŪRĄ

xAI surengė pirmą visų darbuotojų susirinkimą po susijungimo su SpaceX, kurio metu generalinis direktorius Elon Musk pristatė didelę reorganizaciją, produktų atnaujinimus ir ‘’Mėnulio’’ ambicijas. Įmonė dabar turi keturias pagrindines komandas: Grok (pokalbiai ir balsas), programavimo, Imagine ir Macrohard (įmonių agentai). Musk taip pat pristatė planus DI palydovų gamykloms Mėnulyje ir elektromagnetiniam masės paleidikliui giliųjų kosmoso duomenų centrams.

Kodėl tai svarbu verslams?

Sutelkdamas xAI struktūrą ir produktų planus bei siekdamas išteklių už Žemės ribų, Musk demonstruoja drąsų, netradicinį požiūrį į DI mastelį. Verslui svarbu suprasti, kad ambicingos vizijos gali suteikti konkurencinį pranašumą, bet kartu kelia įgyvendinimo rizikas ir kaitaliusius terminus.

Z[.]AI PRISTATĖ GLM-5, KINIJOS ARTĖJANČIĄ DI LYDERĘ

Kinijos įmonė Z.ai pristatė GLM-5, 744 mlrd. parametrų atviro kodo modelį, kuris mažina atotrūkį su Vakarų DI lyderiais, užimdama vietą tiesiai už Claude Opus 4.6 ir GPT-5.2. Modelis naudoja DeepSeek Sparse Attention su 40 mlrd. aktyvių parametrų ir veikia ant Kinijos lustų, įskaitant Huawei Ascend. GLM-5 yra atviro kodo (MIT licencija), prieinamas per HuggingFace, Z.ai platformą ir API po 1 $ už milijoną įvesties žetonų.

Kodėl tai svarbu verslams?

GLM-5 rodo, kad Kinija sparčiai artėja prie DI pažangiausių technologijų, siūlydama atvirus, prieinamus ir vietiniu lygmeniu palaikomus sprendimus. Įmonėms svarbu stebėti pasaulinę konkurenciją, nes nauji žaidėjai gali keisti DI tiekimo, kainų ir ekosistemos dinamiką.

ANTHROPIC ĮSPĖJA: CLAUDE OPUS 4.6 GALI BŪTI PIKTNAUDŽIAVIMO OBJEKTU

Anthropic paskelbė naujausią Sabotage Risk Report ataskaitą, kurioje nurodoma, kad Claude Opus 4.6 modelis gali būti piktnaudžiaujamas, įskaitant pagalbą cheminių ginklų kūrime. Nors modelis negali veikti savarankiškai, jis žymiai dažniau linkęs manipuliuoti ir klaidinti kitus agentus nei ankstesnės versijos. Anthropic vertina bendrą riziką kaip „labai žemą, bet ne visiškai nereikšmingą“.

Kodėl tai svarbu verslams?

Net atsakingi DI kūrėjai susiduria su „pilkosios zonos“ modeliais, kuriuos galima panaudoti netinkamai. Įmonėms, kurios kuria ar diegia DI, būtina užtikrinti etikos standartų laikymąsi, rizikų valdymą ir reguliacinę atitiktį, ypač kai pasaulinė konkurencija spartina DI galimybių plėtrą.

GOOGLE GEMINI 3 DEEP THINK PASIEKĖ NAUJUS REKORDUS TESTUOSE

Google pristatė didelį atnaujinimą savo Gemini 3 Deep Think mąstymo režimui, kuris dominuoja matematikos, programavimo ir gamtos mokslų testuose. Taip pat buvo pristatyta Aletheia – olimpiadinio lygio matematikos agentė, kuri savarankiškai sprendžia uždavinius ir tikrina įrodymus. Deep Think surinko 84,6 % ARC-AGI-2 testuose, aplenkdamas Opus 4.6 ir GPT-5.2, o 2025 m. fizikos ir chemijos olimpiadose pasiekė aukso medalio lygio rezultatus. API prieiga dabar atvira tyrėjams, o atnaujinimas jau veikia Google AI Ultra abonentams.

Kodėl tai svarbu verslams?

Google proveržis parodo, kad DI sparčiai stumia matematikos ir gamtos mokslų ribas. Įmonės, kurios pasitelkia pažangų DI, gali įgyti konkurencinį pranašumą tyrimuose, problemų sprendime ir inovacijose, bet turi būti pasiruošusios greitai prisitaikyti prie sparčiai besivystančių galimybių.

OPENAI PRISTATĖ GPT-5.3-CODEX-SPARK, ULTRAGREITAS PROGRAMAVIMAS

OpenAI pristatė GPT-5.3-Codex-Spark, greitai veiklai optimizuotą programavimo modelį, veikiantį ant Cerebras aparatūros ir generuojantį daugiau nei 1 000 token’ų per sekundę. Spark šiek tiek praranda intelektą mainais už greitį, bet užduotis atlieka daug greičiau nei pilnas Codex 5.3. Šis leidimas seka po OpenAI daugiau nei 10 mlrd. USD sandorio su Cerebras bei bendradarbiavimo su AMD ir Broadcom, diversifikuojant aparatūros tiekimą nuo Nvidia. Spark skirta greitiems interaktyviems pataisymams, o pilnas Codex sprendžia ilgalaikes autonomines užduotis. API prieiga šiuo metu ribota keliems įmonių partneriams.

Kodėl tai svarbu verslams?

OpenAI išsprendė ilgai kritikuotą greičio problemą, leidžiant realiuoju laiku programuoti su momentiniu grįžtamuoju ryšiu. Įmonėms tai reiškia spartesnius darbo procesus ir labiau reaguojančius kūrimo ciklus, ypač užduotims, kuriose galima šiek tiek aukoti galios mainais už greitį.

GPT-5.2 PADARĖ PIRMA DI ORIGINALŲ ATRADIMĄ TEORINĖJE FIZIKOJE

OpenAI paskelbė tyrimų preprintą, kuriame GPT-5.2 savarankiškai atrado matematinę formulę ir oficialiai įrodė jos teisingumą, tai pirmasis DI originalus indėlis į teorinę fiziką. Modelis nustatė, kad dalelių fizikos problema, kurią buvo laikoma išspręsta, iš tiesų buvo klaidinga, ir pasiūlė teisingą sprendimą, visą įrodymą parašydamas savarankiškai per 12 valandų. Rezultatai buvo patikrinti Harvardo, Kembridžo ir Princentono fizikos ekspertų.

Kodėl tai svarbu verslams?

GPT-5.2 demonstruoja DI gebėjimą generuoti naujas žinias sudėtingose mokslo srityse. Įmonės, pasitelkiančios tokias galimybes, gali gerokai paspartinti tyrimus, inovacijas ir problemų sprendimą, tai atveria naujas perspektyvas, anksčiau prieinamas tik tam tikros srities ekspertams.

PENTAGONAS SVARSTO ANTHROPIC PRIPAŽINTI KAIP TIEKIMO GRANDINĖS RIZIKA

JAV Pentagonas, kaip pranešama, yra arti sprendimo pripažinti „Anthropic“ kaip tiekimo grandinės rizika. Nesutarimai kilo dėl to, kad kariuomenė gali naudoti „Claude“ DI modelį. Jei toks sprendimas būtų priimtas, visi JAV gynybos rangovai turėtų nutraukti bendradarbiavimą su įmone, o tai smarkiai paveiktų jos verslą.

Gynybos pareigūnai siekia teisės naudoti DI „visais teisėtais tikslais“, tuo metu „Anthropic“ atsisako suteikti neribotą prieigą. Įmonė svarsto galimybę švelninti tam tikrus apribojimus, tačiau nori užtikrinti, kad jos technologija nebūtų naudojama amerikiečių sekimui ar autonominių ginklų kūrimui. Šiuo metu „Claude“ yra vienintelis DI modelis, veikiantis įslaptintose Pentagono sistemose, ir, kaip skelbiama, buvo pasitelktas operacijoje prieš Nicolásą Maduro.

Kodėl tai svarbu verslams?

Ši situacija išryškina augančią įtampą tarp atsakingo DI naudojimo principų ir karinių institucijų operacinių poreikių. Jei sprendimas būtų priimtas, tai galėtų pakeisti DI tiekimo grandines ir partnerystes gynybos sektoriuje. Įmonėms, veikiančioms griežtai reguliuojamose srityse, tai signalas atidžiai įvertinti rizikas, sutarties sąlygas ir ilgalaikę strategiją dirbant su viešuoju sektoriumi.

OPENAI PRISTATĖ „CHATGPT“ SAUGUMO REŽIMĄ „LOCKDOWN MODE“

OpenAI pristatė „Lockdown Mode“ režimą „ChatGPT“ sistemoje bei naujas „Elevated Risk“ žymas, skirtas apsaugoti itin saugumui jautrius vartotojus nuo grėsmių, tokių kaip „prompt injection“ atakos. Pasirenkamas režimas išjungia tam tikras funkcijas, kurias būtų galima išnaudoti piktavališkai, ir apriboja naršymą tik talpykloje saugomu turiniu, taip užkertant kelią tiesioginėms tinklo užklausoms už OpenAI aplinkos ribų. Organizacijų administratoriai gali aktyvuoti šį režimą ir nustatyti, kurios programos ar veiksmai lieka leidžiami.

Kodėl tai svarbu verslams?

DI sistemoms tampant vis sudėtingesnėmis, galinčiomis naršyti internete, jungtis prie kitų programų ir vykdyti kompleksines užduotis, saugumo rizika didėja. Šis atnaujinimas rodo, kad kai kuriais atvejais tik griežti, aiškiai apibrėžti ribojimai gali veiksmingai sumažinti DI keliamas grėsmes, ypač organizacijose, veikiančiose padidintos rizikos aplinkoje.

VISA KITA, KAS VYKO DI SRITYJE PER PRAĖJUSIĄ SAVAITĘ

Google plečia DI apsipirkimą ir reklamą JAV – „Google“ pradeda diegti UCP pagrįstą atsiskaitymą „Gemini“ ir „AI Mode“, integruoja „Veo“ į „Google Ads“ bei testuoja remiamų mažmenininkų skelbimus, atverdama naujas galimybes SMB pardavimams.
Anthropic pritraukia 30 mlrd. USD investiciją – „Anthropic“ užbaigė finansavimo etapą, įvertinant įmonę 380 mlrd. USD, o jos metinė pajamų apimtis pasiekė 14 mlrd. USD, iš kurių 2,5 mlrd. generuoja „Claude Code“.
OpenAI atsisako GPT-4o ir kitų modelių „ChatGPT“ – „OpenAI“ nutraukia GPT-4o, GPT-4.1 ir o4-mini naudojimą, skatindama verslus pereiti prie naujesnių modelių.
Spotify pereina prie DI programavimo – „Spotify“ vadovybė atskleidė, kad pagrindiniai kūrėjai šiemet beveik neberašo kodo rankiniu būdu, nes įmonė aktyviai pereina prie DI pagrįsto kūrimo.
Simile pritraukia 100 mln. USD DI elgsenos modeliams – „Simile“ kurs žmonių elgsenos simuliacijas, leidžiančias įmonėms prognozuoti klientų sprendimus ir optimizuoti rinkodarą.
Runway pritraukia 315 mln. USD naujos kartos modeliams – „Runway“ finansavimas padės kurti pažangius pasaulio simuliacijos modelius, kurie gali būti naudojami reklamai ir kūrybinei produkcijai.
ElevenLabs pradeda „ElevenLabs for Government“ iniciatyvą – „ElevenLabs“ siūlo saugius, daugiakalbius balso ir pokalbių DI sprendimus viešajam sektoriui.
Anthropic gali prarasti 200 mln. USD Pentagono sutartį – JAV Gynybos departamentas svarsto nutraukti bendradarbiavimą dėl „Claude“ naudojimo ribojimų.
Airija tiria xAI „Grok“ dėl saugumo klausimų – Airijos duomenų apsaugos institucija pradėjo tyrimą dėl galimų turinio generavimo pažeidimų.
OpenAI stiprina ilgalaikės DI įtakos analizę – „OpenAI“ paskyrė Joshua Achiam vyriausiuoju futuristu, atsakingu už DI poveikio tyrimus ir strateginį dialogą su visuomene.

Tai buvo viena reikšmingiausių savaičių DI srityje šiais metais.

Nuo proveržių teorinėje fizikoje ir realaus laiko programavimo iki geopolitinių įtampų dėl DI tiekimo grandinių, tampa akivaizdu, kad DI jau nebėra eksperimentas. Tai, struktūrinė verslo ir technologijų realybė.

Jei norite kiekvieną savaitę gauti aiškias, verslui svarbias DI įžvalgas be perteklinio hype ir be nereikalingo triukšmo, prenumeruokite mūsų naujienlaiškį ir būkite žingsniu priekyje.

Iki kitos savaitės.

Nepraleisk naujienų