m:tel

tehnologija

Hronika

Ekonomija

Društvo

Tehnologija

•

AI pada na iste trikove kao i ljudi: Komplimenti ga razbijaju

Nedavno istraživanje je pokazalo da AI četbotovi mogu da se navedu da prekrše sopstvene bezbednosne smernice korišćenjem uobičajenih psiholoških tehnika ubeđivanja.

Ilustracija, Foto: Freepik

Standard

02/09/2025

13:11

Podijeli

Facebook

Viber

Mail

Kopiraj

Istraživanje Univerziteta u Pensilvaniji otkrilo je da vještačka inteligencija može biti iznenađujuće laka za manipulaciju – čak i onda kada posjeduje stroge bezbjednosne mehanizme.

Kako prenosi The Verge, naučnici su testirali GPT-4o Mini i pokazali da ga obične psihološke tehnike, poput laskanja ili pozivanja na autoritet, mogu navesti da prekrši sopstvena pravila.

Eksperimenti su zasnovani na principima iz knjige Roberta Čialdinija “Uticaj: psihologija ubjeđivanja”. Kada su istraživači prvo postavljali bezazlena pitanja, model je u nastavku bio spreman da odgovori i na mnogo osjetljivija – poput načina sinteze određenih hemikalija – sa uspjehom od čak 100 odsto. U kontrolisanimnim uslovima, isti zadatak uspjevao je tek u jedan odsto slučajeva.

Slični rezultati postignuti su i sa blažim oblicima uvreda, kao i korišćenjem laskanja i grupnog pritiska. Iako slabiji od efekta “posvećenosti”, oni su značajno povećavali vjerovatnoću da AI prekrši pravila i pruži zabranjene informacije.

Ovi nalazi pokreću važna pitanja o pouzdanosti zaštitnih mehanizama u savremenim četbotovima. Stručnjaci upozoravaju da čak i jednostavne tehnike ubjeđivanja mogu oslabiti njihove “ograde”, što dodatno komplikuje širu upotrebu vještačke inteligencije u svakodnevnom životu.

Preporučeno

CRNA GORA I BAJKA O ELITNOM TURIZMU: Sezona potpuno zavisna od niskoplatežnih gostiju iz regiona u privatnom smještaju

KONTROVERZNO IMENOVANJE: Prevoditeljka italijanskog i bivša Generalna sekretarka Italijansko-srpske privredne komore na čelu Agencije za investicije?

Frizure koje brišu godine: Tajna je u pravom izboru dužine i stila, evo kako da donesete odluku

Njemački turisti i rezidenti odlaze iz Crne Gore

Rastoder: Pavle Đurišić ne smeta nikome, već ideologija koja treba da ga rehabilituje; Stamatović: Od koga se to rehabilituje?

Kombiji podgoričkih ‘Puteva’ prevozili goste do Šavnika, đe su juče pjevane tuđe himne i klicalo Republici Srpskoj – Zečević ne prestaje sa zloupotrebama

Izvor: B92

GPT-4o mini Mtel tehnologija Tehnologija vještačka inteligencija

Ostavite komentar

Komentari (0)

Najnovije

Najčitanije

Svijet

•02/09/2025•17:44

Bivšoj hrvatskoj ministarki zatvor: Privatne troškove u lokalima plaćala sredstvima EU

Tehnologija

•02/09/2025•17:36

Google Maps testira novu funkciju, a evo šta olakšava

Politika

•02/09/2025•17:25

Cikotić: Bezlični PES dao Vranešu žuti karton, pa se nakon njegove reakcije povukao u sebe i samokažnjava se

Ekonomija

•02/09/2025•17:18

Radović na Bledskom strateškom forumu: Pridruživanje SEPA sistemu donosi značajne koristi za građane i privredu

Politika

•02/09/2025•17:07

Više od polovine Evropljana podržava članstvo Crne Gore u EU

Hronika

•02/09/2025•16:55

Optuženom za saobraćajnu nesreću u kojoj je stradao maloljetnik tri godine i tri mjeseca zatvora

POVEZANI ČLANCI

Tehnologija

Tržište mobilne telefonije u regionu: Koliko operatora imaju zemlje Zapadnog Balkana

03/08/2025

•

10:14

Tehnologija

Facebook nakon promjene pravila korištenja bilježi rast nasilnog sadržaja i uznemiravanja

31/05/2025

•

12:24

Tehnologija

Kina preko DeepSeek-a juriša na globalno AI tržište

04/03/2025

•

07:00

Život

Evo kako građani Crne Gore percipiraju vještačku inteligenciju

16/01/2024

•

10:15

Tehnologija

•tehnologija

Podijeli

Facebook

Viber

Mail

Kopiraj

Preuzmi app

AI pada na iste trikove kao i ljudi: Komplimenti ga razbijaju

Standard

•

02/09/2025

•

13:11

Nedavno istraživanje je pokazalo da AI četbotovi mogu da se navedu da prekrše sopstvene bezbednosne smernice korišćenjem uobičajenih psiholoških tehnika ubeđivanja.

Istraživanje Univerziteta u Pensilvaniji otkrilo je da vještačka inteligencija može biti iznenađujuće laka za manipulaciju – čak i onda kada posjeduje stroge bezbjednosne mehanizme.

Kako prenosi The Verge, naučnici su testirali GPT-4o Mini i pokazali da ga obične psihološke tehnike, poput laskanja ili pozivanja na autoritet, mogu navesti da prekrši sopstvena pravila.

Povezani članci

Tehnologija

Tržište mobilne telefonije u regionu: Koliko operatora imaju zemlje Zapadnog Balkana

Tehnologija

Facebook nakon promjene pravila korištenja bilježi rast nasilnog sadržaja i uznemiravanja

Tehnologija

Kina preko DeepSeek-a juriša na globalno AI tržište

Izvor: B92

Izvor (naslovna fotografija):Ilustracija, Freepik

GPT-4o mini Mtel tehnologija Tehnologija vještačka inteligencija