Home Tech ஒரு புதிய AI சோதனை ஓபனாய், கூகிள் மாடல்களை விட அதிகமாக உள்ளது

ஒரு புதிய AI சோதனை ஓபனாய், கூகிள் மாடல்களை விட அதிகமாக உள்ளது

8
0

கூகிள், ஓப்பனாய், டீப்ஸீக், மற்றும் பலர். ஒரு புதிய அளவுகோல் படி, ஏஜிஐ (செயற்கை பொது நுண்ணறிவு) அடைவதற்கு எங்கும் இல்லை.

ஏஜிஐ முன்னேற்றத்தை அளவிடும் ஒரு இலாப நோக்கற்ற ARC பரிசு அறக்கட்டளை, முன்னணி AI மாதிரிகளை ஸ்டம்பிங் செய்யும் ஒரு புதிய அளவுகோலைக் கொண்டுள்ளது. ARC-AGI-2 எனப்படும் இந்த சோதனை, இரண்டாவது பதிப்பு ARC-AGI பெஞ்ச்மார்க் ஆகும், இது மாதிரி அங்கீகாரம், சூழல் தடயங்கள் மற்றும் பகுத்தறிவு ஆகியவற்றைப் பயன்படுத்தி காட்சி புதிர்களை தீர்க்க சவால் விடுவதன் மூலம் பொது நுண்ணறிவின் மாதிரிகளை சோதிக்கிறது.

ARC-AGI லீடர்போர்டின் கூற்றுப்படி, ஓபனாயின் மிக மேம்பட்ட மாடல் O3-LOW 4 சதவீதம் மதிப்பெண் பெற்றது. கூகிளின் ஜெமினி 2.0 ஃப்ளாஷ் மற்றும் டீப்ஸீக் ஆர் 1 இரண்டும் 1.3 சதவீதம் மதிப்பெண் பெற்றன. ஆந்த்ரிக்ஸின் மிகவும் மேம்பட்ட மாதிரி, 8 கே டோக்கன் வரம்புடன் கிளாட் 3.7 (இது ஒரு பதிலைச் செயலாக்கப் பயன்படுத்தப்படும் டோக்கன்களின் அளவைக் குறிக்கிறது) 0.9 சதவீதம் மதிப்பெண் பெற்றது.

மேலும் காண்க:

சாட்ஜ்ட், டீப்ஸீக் மற்றும் பிற AI போட்டியாளர்களுடன் க்ரோக் 3 எவ்வாறு ஒப்பிடுகிறது

ஏஜிஐ எப்படி, எப்போது அடையப்படும் என்ற கேள்வி எப்போதையும் போலவே சூடாக இருக்கிறது, பல்வேறு பிரிவுகள் காலவரிசையைப் பற்றி வெட்கப்படுகிறதா அல்லது அது சாத்தியமா என்பது கூட. மானுட தலைமை நிர்வாக அதிகாரி டாரியோ அமோடி, இது இரண்டு முதல் மூன்று ஆண்டுகள் வரை ஆகலாம் என்று கூறினார், மேலும் ஓப்பனாய் தலைமை நிர்வாக அதிகாரி சாம் ஆல்ட்மேன் “இது தற்போதைய வன்பொருளுடன் அடையக்கூடியது” என்று கூறினார். ஆனால் கேரி மார்கஸ் மற்றும் யான் லெகுன் போன்ற வல்லுநர்கள் கூறுகையில், தொழில்நுட்பம் இன்னும் இல்லை என்றும், பெரிய முதலீடுகளைத் தேடும் AI நிறுவனங்களுக்கு AGI ஹைப் எரிபொருள் எவ்வாறு சாதகமானது என்பதைப் பார்க்க ஒரு நிபுணரை எடுக்கவில்லை.

Mashable ஒளி வேகம்

ஆர்க்-ஏஜிஐ பெஞ்ச்மார்க், மனப்பாடம் செய்யும் பொறியைத் தவிர்ப்பதன் மூலம் சிறப்பு நுண்ணறிவுக்கு அப்பாற்பட்ட AI மாதிரிகளை சவால் செய்ய வடிவமைக்கப்பட்டுள்ளது-அதன் அர்த்தம் என்ன என்பதைப் புரிந்து கொள்ளாமல் பிஎச்.டி-நிலை பதில்களைத் தூண்டுகிறது. அதற்கு பதிலாக, புதிய தகவல்களை எடுத்துக்கொள்வதற்கும் அனுமானங்களைச் செய்வதற்கும் நமது உள்ளார்ந்த திறன் காரணமாக மனிதர்களுக்கு தீர்க்க எளிதான புதிர்களில் இது கவனம் செலுத்துகிறது, இதனால் AI மாதிரிகளை அதிக தரவுகளுக்கு உணவளிப்பதன் மூலம் தீர்க்க முடியாத இடைவெளிகளை வெளிப்படுத்துகிறது.

“நுண்ணறிவுக்கு வரையறுக்கப்பட்ட அனுபவத்திலிருந்து பொதுமைப்படுத்தவும், புதிய, எதிர்பாராத சூழ்நிலைகளில் அறிவைப் பயன்படுத்தவும் திறன் தேவைப்படுகிறது. AI அமைப்புகள் ஏற்கனவே பல குறிப்பிட்ட களங்களில் மனிதநேயமற்றவை (எ.கா., விளையாடும் மற்றும் பட அங்கீகாரம்)” அறிவிப்பைப் படியுங்கள்.

மேலும் காண்க:

நான் எள் சாட்ஜிப்ட் குரல் பயன்முறையுடன் ஒப்பிட்டேன், நான் கவலைப்படவில்லை

“இருப்பினும், இவை குறுகிய, சிறப்பு திறன்கள். ‘மனித -ஏஐ இடைவெளி’ பொது நுண்ணறிவுக்கு என்ன காணவில்லை என்பதை வெளிப்படுத்துகிறது – புதிய திறன்களை மிகவும் திறமையாகப் பெறுகிறது.”

AI மாடல்களின் தற்போதைய வரம்புகளைப் புரிந்துகொள்ள, நீங்கள் ARC-AGI சோதனையை நீங்களே எடுக்கலாம். அதன் எளிமையால் நீங்கள் ஆச்சரியப்படலாம். சில விமர்சன சிந்தனைகள் உள்ளன, ஆனால் ARC-AGI சோதனை அடுத்த இடத்திற்கு வெளியே இருக்காது நியூயார்க் டைம்ஸ் குறுக்கெழுத்து புதிர், வேர்டில் அல்லது பிற பிரபலமான மூளை டீஸர்கள். இது சவாலானது ஆனால் சாத்தியமற்றது அல்ல, புதிரின் தர்க்கத்தில் பதில் உள்ளது, இது மனித மூளை விளக்குவதற்கு உருவாகிய ஒன்று.

ஆர்க்-அஜியின் முதல் பதிப்பில் ஓபனாயின் O3-LOW மாடல் 75.7 சதவீதம் மதிப்பெண் பெற்றது. ஒப்பிடுகையில், இரண்டாவது பதிப்பில் அதன் 4 சதவீத மதிப்பெண் சோதனை எவ்வளவு கடினம் என்பதைக் காட்டுகிறது, ஆனால் மனித அளவிலான நுண்ணறிவை அடைவதன் மூலம் இன்னும் நிறைய வேலைகள் செய்யப்பட வேண்டும்.



ஆதாரம்