loader
Foto

Ce trebuie să știm despre DeepSeek, modelul de inteligență artificială care a șocat Occidentul

RECOMANDARI

Odată cu lansarea celui mai recent model de inteligență artificială (IA), DeepSeek, o firmă chineză obscură, a dinamitat ani întregi de politică americană menită să frâneze inovarea chineză. Și nu doar atât, ci a făcut și-o gaură în evaluările unor companii, de la Nvidia, campioana americană a cipurilor IA, la Siemens Energy, un producător de echipamente electrice pentru centrele de date.

 

Demonstrându-și capacitatea de-a inova fără a aduce atingere restricțiilor americane la export, DeepSeek a doborât ceea ce pare a fi acum un mit. Până recent, se credea că accesul la semiconductorii de ultimă generație și la echipamentele conexe este vital în formarea modelelor de inteligență artificială.

Omul care se află în ochiul furtunii este Liang Wenfeng, fondatorul DeepSeek, în vârstă de 40 de ani. Nu este clar cât de mult s-a bucurat de turbulențele declanșate pe piața globală. Luat în derâdere pe rețelele de socializare chineze pentru aspectul său slab și palid, Liang rămâne un mister pentru majoritatea oamenilor.

Cei care au avut relații profesionale cu DeepSeek spun că acesta este obsedat de inteligența generală artificială (IGA) de tip uman și de impactul pe care l-ar putea avea asupra lumii. În căutările sale, fondatorul DeepSeek bulversează teoriile despre progresul tehnologic atât în Occident, cât și în China, scrie The Economist.

Informațiile publice despre Liang sunt puține. Născut în 1985 într-o familie de profesori dintr-un sătuc sărac din apropierea orașului Zhanjiang, în sudul Chinei, Liang Wenfeng a fost un elev talentat. Un fost profesor spune că stăpânea matematica de nivel universitar încă din școala generală. În 2002, a început să studieze informatica electronică la Universitatea Zhejiang, o prestigioasă școală din orașul Hangzhou din estul Chinei. O diplomă de masterat la aceeași universitate, sub îndrumarea unui renumit om de știință, i-a pavat drumul spre domeniul inteligenței artificiale.

La acea vreme, Hangzhou era un centru înfloritor pentru tehnologia internetului. Aici a ieșit la rampă compania de comerț electronic Alibaba.

Liang și câțiva colegi de clasă au rămas în oraș și-au început să experimenteze cu modele de investiții cantitative, care nu se bazează pe datele fundamentale ale companiilor, ci pe procesarea unui volum mare de date. În 2013, Liang și trei colegi de clasă au lansat un grup de investiții numit Yakebi, în încercarea de-a monetiza modelele de tranzacționare pe care le construiseră.

Doi ani mai târziu, a co-fondat High-Flyer, un fond de hedging cantitativ care a crescut rapid alături de zeci de firme similare într-o perioadă de dereglementare și volatilitate a pieței din China. În 2021, High-Flyer pretindea că gestionează până la 100 de miliarde de yuani (14 miliarde de dolari), deși se pare că și-a redus rapid dimensiunea în a doua jumătate a acelui an.

Fondurile cantitative s-au confruntat în mod regulat cu autoritățile de reglementare chineze, care consideră că acestea profită de pe urma derapajelor pieței. Cei din industrie spun că High-Flyer s-a remarcat ca unul dintre cele mai agresive fonduri cantitative, atrăgându-și în mod regulat furia autorităților de reglementare a valorilor mobiliare.

Prima lovitură

Originile DeepSeek se află în efortul de-a îmbunătăți algoritmii High-Flyer. În 2019, grupul a investit 200 de milioane de yuani pentru a-și dezvolta propria platformă de învățare profundă (deep learning), denumită „Fire-Flyer 1”. Fondul a vărsat 1 miliard de yuani în acest proiect în 2021, pentru a lansa o a doua iterație echipată cu 10 000 de unități de procesare grafică Nvidia A100. Acest lucru a făcut din High-Flyer un caz excepțional: la momentul respectiv, doar alte patru firme din China dețineau arsenale atât de mari de cipuri puternice, toate fiind giganți tehnologici precum Alibaba.

DeepSeek a devenit o companie de sine stătătoare în 2023.

Aceasta a dat prima lovitură pieței în luna mai a anului trecut, când a lansat un chatbot ultra-ieftin bazat pe modelul său V2. Acest lucru a declanșat un război al prețurilor în industria inteligenței artificiale din China, forțând cele mai mari firme de tehnologie din țară - Alibaba, Baidu, ByteDance și Tencent – să-și reducă prețurile.

După spusele lui Liang, nu a fost o manevră pentru a atrage mai mulți utilizatori. În iulie, acesta a declarat că costurile au scăzut pe măsură ce DeepSeek a explorat noi structuri de model, ceea ce l-a diferențiat de ceilalți. Deși grupurile chineze rivale de inteligență artificială au efectuat cercetări în domeniul modelelor, dezavantajul lor în ceea ce privește puterea de calcul, din cauza restricțiilor americane la export, le-a determinat să se concentreze mai mult pe crearea de aplicații inteligente care utilizează tehnologia. Multe grupuri chineze de inteligență artificială au folosit Llama, familia de modele lingvistice mari dezvoltate de Meta, titanul american al social media, ca bază pentru aplicațiile lor.

Pentru Liang Wenfeng, dezvoltarea de modele care utilizează mai puțină putere de calcul este un pas esențial în urmărirea obiectivului său pe termen lung. „Scopul nostru este IGA, ceea ce ne obligă să explorăm noi structuri de modele pentru a obține capacități superioare cu resurse limitate”, a declarat el presei locale.

Șocul

Noul model R1 al DeepSeek, care a șocat Occidentul, sugerează că se fac progrese. Compania spune că pregătirea noului model a costat mai puțin de 6 milioane de dolari, o fracțiune infimă din modelele comparabile de la OpenAI, producătorul ChatGPT. Sam Altman, șeful OpenAI, a spus că R1 este „impresionant” (și a promis, de asemenea, că va produce „modele mult mai bune”).

DeepSeek are, cu siguranță, scepticii săi. Primele teste par să confirme că R1 este la fel de puternic pe cât susține producătorul său. Dar unii s-au întrebat dacă firma a subestimat numărul de cipuri high-end pe care le-a folosit pentru a dezvolta modelul, chiar dacă alții susțin că afirmațiile companiei sunt plauzibile. Există, de asemenea, speculații conform cărora DeepSeek și-a format modelele studiind rezultatele modelelor americane, un proces cunoscut sub numele de „distilare”. OpenAI a declarat că are dovezi care indică faptul că DeepSeek își distilează modelele.

Cu toate acestea, dacă DeepSeek este cu adevărat eficient, așa cum mulți cred, atunci este un afront atât la adresa „înțelepciunii” tehnologice americane, cât și la adresa modelului de inovare condus de statul chinez. Mass-media chineză de stat a promovat rapid DeepSeek drept un avantaj național în lupta țării pentru supremația IA. Liang a fost invitat la o întâlnire cu Li Qiang, premierul Chinei, pe 20 ianuarie, alături de o mână de alți antreprenori.

Cu toate acestea, după cum subliniază Zhang Zhiwei de la Pinpoint Asset Management, o firmă de investiții, realizările DeepSeek nu provin grație institutelor de cercetare susținute de guvern sau datorită companiilor controlate de stat din China. Liang pare să controleze majoritatea acțiunilor DeepSeek și s-a ferit de industria de capital de risc dominată de statul chinez.

Liang consideră că rolul Chinei din ultimii 30 de ani a fost acela de „discipol” tehnologic, construind pe bazele dezvoltate în Occident. Diferența dintre America și China este între „originalitate și imitație”, a declarat Liang într-un interviu acordat presei locale în iulie. Succesul Nvidia, susține el, nu s-a bazat doar pe propriile performanțe, ci și pe colaborarea tehnologică dintre companiile occidentale. În opinia sa, încercările Chinei de-a imita puterea de calcul occidentală au eșuat, deoarece lipsește acest tip de colaborare.

Așadar, DeepSeek nu pare un semnal de alarmă doar pentru Occident, ci și pentru liderii chinezi de la Beijing.

Sursă foto: mundissima / Shutterstock.com

Logo

 
Marina Almăşan: „Mă declar din nou cucerită de sufletul moldovenesc!” Hai-Hui prin Chişinău, miercuri seară, la TVR 2

„Un oraș în tranziție, în care clădirile noi și cele vechi stau drepţi, una lângă cealaltă.” Astfel descrie Marina Almăşan capitala Republicii ...

„TVR a fost, este şi va fi preferata mea!” – Sanda Ladoși, invitată la Revelion 2026

Una dintre cele mai versatile și apreciate voci ale muzicii românești, cea care a reprezentat România la Eurovision 2004 și este unul dintre ...

Nevoi importante pe care sportul le poate satisface

Calitatea motivației sportivilor crește atunci când mediul de antrenament satisface nevoile psihologice fundamentale de autonomie, competență și ...

Din 15 decembrie, " Secretele de la palat" continuă seria dramelor istorice coreene şi aduce povestea frumoasei regine Seondeok. De luni până ...

Moţiunea de cenzură în care se cere demisia Guvernului, dezbatere și vot

Parlamentul României se pregătește pentru dezbaterea și votul moțiunii de cenzură intitulate „România nu este de vânzare – fără progresiști la ...

„Atmosfera aceasta de petrecere este fix… ca la 20 de ani!” Voltaj, energie și emoție în programul de Revelion la TVR 1

„Televiziunea Română prezintă: Revelion 2026” – programul TVR 1 din noaptea de 31 decembrie aniversează într-un mod cu totul special intrarea în ...

Irina Loghin, „regina muzicii populare”, pe scena Revelionului TVR 2026

Voce emblematică a folclorului românesc, Irina Loghin este invitată în „Televiziunea Română prezintă: Revelion 2026”, programul care deschide ...

În această ediție vă invităm să privim împreună lumea animalelor cu mai multă atenție, cu mai multă responsabilitate și cu inima deschisă. ...

Umbrele NeLibertății, o dezbatere „Omul și Timpul”, la TVR Cultural

„Revoluția din decembrie 1989 a devenit un paradox fără comparație: prima revoluție urmată de plecarea învingătorilor, nu a învinșilor. 1989 ...

Revitalizarea zonelor rurale din România reprezintă o provocare complexă a cărei soluționare depinde, în mare măsură, de succesul ...

Ștefan de Faÿ, un ambasador al demnității românești: „Excelența înseamnă respect egal pentru toată lumea!”

Duminică, 14 decembrie, ora 15:30, la TVR Cultural, „Portret de Excelență” îl are ca invitat pe Ștefan de Faÿ, Consul General Onorific al ...

Andrei Ursu (WRS) petrece Revelionul în familie. În familia TVR

Artistul care au cunoscut o ascensiune notabilă în ultimii ani, mai ales după participarea sa la Eurovision, se numără printre invitaţii ...

„Cum ne omorâm femeile” – un documentar tulburător la „Dosar România”

FEMICID. Cum ajunge un bărbat să devină ucigaș și ce semne de avertizare a ratat societatea? Realizatoarea TVR Alina Amza trage un semnal de ...

Peste 500 de procurori și judecători, mesaj de susținere pentru magistrații care au făcut dezvăluiri

Dezvăluirile din documentarul de investigație „Justiție Capturată” realizat de Recorder continuă să cutremure sistemul judiciar, generând o ...

Europa League: FCSB – Feyenoord 4-3

Campioana României, FCSB, a reușit o performanță de senzație miercuri seară, în fața puternicei formații olandeze Feyenoord, obținând un succes ...