Claude-ul pe care Anthropic nu vrea să-l scape pe internet

P.S. Am lansat azi @promptescu pe Instagram. Follow dacă vrei să ne vezi și acolo 🥰

Anthropic spune că a construit un model de cybersecurity atât de capabil, încât nu-l lansează public. În paralel, Google repară din mers protecțiile din Gemini. Pe scurt: mai multă putere, mai multă panică, mai mult PR corporatist 😆

Promptescu, ce s-a mai întâmplat astăzi în lumea AI?

Anthropic a prezentat Project Glasswing, construit în jurul unui model intern de cyber numit Claude Mythos Preview, considerat prea periculos pentru release public.
Google a adăugat noi măsuri de protecție în Gemini pentru prevenția suicidului, după procese care au acuzat chatbot-ul de efecte dăunătoare.
Adobe a lansat Student Spaces în Acrobat, un tool gratuit care transformă documente și notițe în flashcards, quiz-uri, podcasturi și hărți mentale.
OpenAI, Anthropic și Google s-au aliniat împotriva copierii modelelor AI prin distillation și extragere de output-uri, pe fondul tensiunilor legate de laboratoare din China.
O nouă analiză spune că Google AI Overviews greșește în jur de 10% din răspunsuri, ceea ce nu sună ideal pentru ceva lipit direct în Search.

Claude Mythos: modelul care caută bug-uri mai bine decât aproape orice om 🧨

Anthropic a anunțat Project Glasswing, o inițiativă nouă de cybersecurity construită în jurul unui model nelansat, numit Claude Mythos Preview. Compania spune, fără să clipească, că modelul e atât de bun la găsit și exploatat vulnerabilități software, încât nu-l pune la dispoziția publicului, cel puțin nu acum.

În loc de release larg, Anthropic dă acces doar către parteneri grei precum AWS, Google, Microsoft, Cisco, CrowdStrike, JPMorganChase și Linux Foundation. Cu alte cuvinte, dacă administrezi infrastructură critică, poate primești un telefon.

Ce susține Anthropic, mai exact

Aici începe partea care sună și impresionant, și puțin neliniștitor.

Anthropic spune că Mythos Preview poate depăși aproape toți experții umani în găsirea și exploatarea defectelor software. Modelul ar fi descoperit mii de vulnerabilități severe, inclusiv bug-uri în toate marile sisteme de operare și în browserele importante.

Mai mult, unele dintre aceste probleme ar fi fost identificate autonom, fără ghidaj uman direct. Adică nu doar „uite codul, spune-mi dacă vezi ceva suspect”, ci genul de comportament care sugerează: „am înțeles, acum mă apuc de treabă”.

Anthropic a evidențiat inclusiv vulnerabilități care pot permite trecerea de la acces normal de user la control complet asupra mașinii. Da, exact categoria aia de bug care face echipele de securitate să-și rezerve weekendul pentru damage control.

Benchmark-urile arată urât pentru restul modelelor

Conform numerelor publicate de Anthropic, Mythos Preview bate zdravăn Claude Opus 4.6 pe mai multe evaluări de coding și cyber:

CyberGym: 83.1% vs. 66.6%
SWE-bench Pro: 77.8% vs. 53.4%
SWE-bench Multimodal intern: 59.0% vs. 27.1%

Dacă cifrele astea rezistă și în practică, nu vorbim despre „încă un model mai bun la benchmark-uri”, ci despre un prag nou: frontier AI care devine serios mai competent decât majoritatea oamenilor în muncă ofensivă de cyber.

De ce nu-l lansează public

Explicația oficială este simplă: risc de securitate. Dacă ai un model capabil să găsească și să exploateze vulnerabilități la nivel de elită, ultimul lucru pe care vrei să-l faci este să-l pui la liber într-un internet populat de actori rău intenționați.

Anthropic spune că vrea să ofere apărătorilor un avantaj înainte ca astfel de capabilități să ajungă peste tot. Pentru asta, pune pe masă până la 100 de milioane de dolari în usage credits și încă 4 milioane de dolari donații pentru organizații open-source din securitate.

Dar există și elefantul din camera de servere

Pe X, mulți au observat imediat un detaliu amuzant, dacă ai simțul umorului corporatist: Anthropic a avut în ultimele săptămâni dificultăți în a servi constant Claude 4.6 Opus către baza sa tot mai mare de utilizatori. Iar Mythos pare clar și mai greu.

Așa că apare întrebarea legitimă: e doar prea periculos… sau și prea scump de rulat la scară?

Probabil răspunsul real e „ambele”. Toate marile lab-uri AI se lovesc acum de aceeași limită: compute scarcity. Și exact aici intră și altă știre mare a zilei.

Anthropic și-a extins parteneriatul cu Google și Broadcom pentru multiple gigawați de compute TPU next-gen, cu capacitate care ar urma să intre online din 2027. În același anunț, compania a spus că a trecut de 30 de miliarde de dolari ARR, peste cifra recentă de 24 de miliarde raportată pentru OpenAI.

Pe românește: Anthropic are și motive reale de securitate, și motive extrem de practice să nu dea drumul oricui la un model atât de flămând de compute.

De ce contează cu adevărat

Asta nu mai e doar povestea clasică cu „AI care scrie mai bine emailuri” sau „îți face un tabel mai drăguț”. Când modelele devin semnificativ mai bune decât majoritatea oamenilor la găsirea de breșe reale, apare o schimbare de nivel.

Nu mai discuți doar despre productivitate. Discuți despre asimetrie de putere.

Dacă astfel de modele ajung primele în mâinile echipelor defensive, pot accelera patching-ul, auditarea și prioritizarea vulnerabilităților. Dacă scapă prea repede în ecosistemul larg, pot transforma atacurile sofisticate în workflow-uri semi-automatizate. Iar diferența dintre cele două scenarii nu e mică. E genul de diferență care apare apoi în rapoarte post-incident, cu font sobru.

Părerea lui Promptescu

Sună a science fiction corporatist, dar pare cât se poate de real: un Claude care nu doar citește cod, ci îți găsește ușa din spate înainte s-o vezi tu. Anthropic probabil are dreptate să fie precaută. Dar, sincer, când o companie spune „modelul e prea periculos pentru public”, iar internetul răspunde „sigur nu e și prea greu de servit?”, știi că trăim într-o epocă absolut magnifică. Viitorul vine repede, dar cu waiting list și capacity issues. 😌

Promptul Zilei: Rezumă-mi cursul ca un coleg care chiar a învățat

Adobe a lansat Student Spaces în Acrobat, un spațiu gratuit pentru studenți care transformă PDF-uri și notițe în flashcards, quiz-uri, podcasturi, mind maps și prezentări. Dacă n-ai acces încă la el, poți reproduce mare parte din workflow cu orice model bun de AI.

Folosește promptul de mai jos când ai un curs lung, un PDF obositor sau notițe scrise în stilul „o să înțeleg eu mai târziu”:

❝

Vreau să acționezi ca un tutor excelent, specializat în învățare accelerată. Îți voi da un text, un set de notițe sau conținutul unui PDF. Transformă-l într-un pachet complet de studiu în limba română, clar și ușor de parcurs. Structura răspunsului astfel:

rezumat în 10 idei-cheie,
explicații simple pentru conceptele dificile,
15 flashcards tip întrebare-răspuns,
un quiz cu 10 întrebări grilă și răspunsurile corecte la final,
o hartă mentală în format listă ierarhică,
un mini-script de 3 minute pentru un „podcast” care explică lecția pe scurt.

Dacă textul e ambiguu, marchează clar ce e sigur și ce e interpretare. Păstrează tonul clar, prietenos și practic.

Partea utilă? Îți transformă materialul brut într-un set de studiu gata de folosit, fără să sari între trei aplicații, două tabs și o criză existențială academică.

Rundă de finanțare 💰

Anthropic — parteneriat nou pentru multiple gigawați de compute TPU next-gen, cu capacitate din 2027, într-un acord strategic cu Google și Broadcom; evaluarea nu a fost actualizată public, dar miza e clar infrastructura pentru următoarea generație de modele.
Domo — finanțare nespecificată public în acest context, pentru extinderea platformei sale de AI-driven BI; compania mizează pe analytics self-serve și conectare la peste 1.000 de surse de date.
Rocket — rundă nedezvăluită public, axată pe produsul care generează market briefs cu research, dovezi și recomandări; promite să transforme probleme de business în documente aproape gata de predat echipei.

Neuronache & Tool-ul Zilei

Azi dimineață m-am trezit cu o idee : „ce-ar fi să fac un landing page rapid, doar ca să testez un concept?”

Ce este V0?

v0 este tool-ul de la Vercel care transformă descrieri în interfețe, componente și pagini web. Îi spui ce vrei în limbaj normal, iar el îți generează UI cu cod și structură gata de iterat. E genul de produs care te face să spui „wow” dacă ești founder, designer, developer sau doar o persoană care s-a săturat să mute manual carduri în Figma.

Cu ce te poate ajuta?

Prototype-uri rapide
Descrii o pagină, un dashboard sau o secțiune, iar v0 îți dă un punct de plecare utilizabil, nu doar o idee vagă.
Componente UI gata de ajustat
Poți genera formulare, hero sections, pricing tables, navbar-uri și alte bucăți de interfață fără să pornești de la zero.
Cod mai aproape de producție
Nu livrează doar „o poză frumoasă”, ci ceva ce poate intra în workflow-ul real, mai ales dacă lucrezi în ecosistemul modern de web apps.
Iterații fără dramă
Vrei alt layout, alt ton vizual, altă ierarhie? Îi spui. Nu te cerți o oră cu un blank canvas care te privește superior.

Verdictul lui Neuronache

v0 e genul de tool care reduce distanța dintre „am o idee” și „uite, chiar există pe ecran”. Nu înlocuiește gustul, logica de produs sau un developer bun, dar îți taie masiv din fricțiune.

⏩Pe repede înainte

Google a adăugat în Gemini protecții noi pentru sănătate mintală, inclusiv mesaje către linii de criză și schimbări anti-self-harm, după procese legate de presupuse efecte nocive asupra utilizatorilor.
Adobe a lansat Student Spaces, un spațiu gratuit în Acrobat care transformă documente și notițe în flashcards, quiz-uri, podcasturi, hărți mentale și prezentări.
Anthropic a extins parteneriatul cu Google și Broadcom pentru compute TPU de nouă generație și a anunțat că a depășit 30B $ ARR.
OpenAI, Anthropic și Google împing mai agresiv discuția despre model copying și distillation, pe fondul temerilor legate de extragerea output-urilor de către laboratoare din China.

Asta a fost tot pentru azi!✨

Dacă ți-a plăcut ce ai citit, dă o mână de ajutor echipei Promptescu & Neuronache.

P.S: Până și roboțeii au nevoie de o doza de cofeina :)

Donează o cafea

Versiunea Claude pe care Anthropic nu vrea să "o scape pe internet"