
ஆரம்பம்ஸ்டான்போர்ட் கணினி அறிவியல் பேராசிரியர் ஸ்டெபனோ எர்மன் தொடங்கிய புதிய பாலோ ஆல்டோவை தளமாகக் கொண்ட ஒரு நிறுவனம், “பரவல்” தொழில்நுட்பத்தின் அடிப்படையில் ஒரு நாவல் AI மாதிரியை உருவாக்கியதாகக் கூறுகிறது. தொடக்கமானது இதை ஒரு பரவல் அடிப்படையிலான பெரிய மொழி மாதிரி அல்லது சுருக்கமாக “டிஎல்எம்” என்று அழைக்கிறது.
இப்போது அதிக கவனத்தைப் பெறும் உருவாக்கும் AI மாதிரிகள் இரண்டு வகைகளாக பரவலாக பிரிக்கப்படலாம்: பெரிய மொழி மாதிரிகள் (எல்.எல்.எம்) மற்றும் பரவல் மாதிரிகள். எல்.எல்.எம்.எஸ் மின்மாற்றி கட்டிடக்கலைஉரை உருவாக்கத்திற்கு பயன்படுத்தப்படுகின்றன. இதற்கிடையில், மிட்ஜோர்னி மற்றும் ஓபனாயின் சோரா போன்ற AI அமைப்புகளை இயக்கும் பரவல் மாதிரிகள் முக்கியமாக படங்கள், வீடியோ மற்றும் ஆடியோவை உருவாக்கப் பயன்படுகின்றன.
இன்செப்சரின் மாதிரி பாரம்பரிய எல்.எல்.எம்-களின் திறன்களை வழங்குகிறது, இதில் குறியீடு உருவாக்கம் மற்றும் கேள்வி-பதில் அளித்தல், ஆனால் கணிசமாக வேகமான செயல்திறன் மற்றும் குறைக்கப்பட்ட கணினி செலவுகள் ஆகியவை நிறுவனம் தெரிவித்துள்ளது.
எர்மான் டெக் க்ரஞ்சிடம் தனது ஸ்டான்போர்ட் ஆய்வகத்தில் நீண்ட காலமாக பரவல் மாதிரிகளை எவ்வாறு பயன்படுத்துவது என்று படித்து வருவதாக கூறினார். பரவல் தொழில்நுட்பத்துடன் ஒப்பிடும்போது பாரம்பரிய எல்.எல்.எம் கள் ஒப்பீட்டளவில் மெதுவாக உள்ளன என்ற கருத்தை அடிப்படையாகக் கொண்டது அவரது ஆராய்ச்சி.
எல்.எல்.எம்.எஸ் உடன், “நீங்கள் முதல் ஒன்றை உருவாக்கும் வரை இரண்டாவது வார்த்தையை உருவாக்க முடியாது, முதல் இரண்டை உருவாக்கும் வரை மூன்றாவது ஒன்றை உருவாக்க முடியாது” என்று எர்மன் கூறினார்.
உரைக்கு ஒரு பரவல் அணுகுமுறையைப் பயன்படுத்துவதற்கான வழியை எர்மான் தேடிக்கொண்டிருந்தார், ஏனெனில், எல்.எல்.எம்.எஸ்ஸைப் போலல்லாமல், தொடர்ச்சியாக வேலை செய்யும், பரவல் மாதிரிகள் அவர்கள் உருவாக்கும் தரவின் தோராயமான மதிப்பீட்டில் தொடங்குகின்றன (எ.கா., ஒரு படம்), பின்னர் தரவை ஒரே நேரத்தில் கவனம் செலுத்துகின்றன.
எர்மான் அனுமானிக்கப்பட்டார், பெரிய உரையின் பெரிய தொகுதிகளை இணையாக மாற்றுவது பரவல் மாதிரிகளுடன் சாத்தியமானது. பல வருட முயற்சிகளுக்குப் பிறகு, எர்மனும் அவரது மாணவரும் ஒரு பெரிய முன்னேற்றத்தை அடைந்தனர், அவர்கள் ஒரு விவரிக்கப்பட்டுள்ளனர் ஆய்வுக் கட்டுரை கடந்த ஆண்டு வெளியிடப்பட்டது.
முன்னேற்றத்தின் திறனை உணர்ந்து, கடந்த கோடையில் தொடக்கத்தை நிறுவிய எர்மன், யு.சி.எல்.ஏ பேராசிரியர் ஆதித்யா க்ரோவர் மற்றும் கார்னெல் பேராசிரியர் வோலோடிமைர் குலேஷோவ் ஆகிய இரண்டு முன்னாள் மாணவர்களைத் தட்டினார்.
தொடக்கத்தின் நிதி பற்றி விவாதிக்க எர்மன் மறுத்துவிட்டாலும், மேஃபீல்ட் நிதி முதலீடு செய்துள்ளது என்பதை டெக் க்ரஞ்ச் புரிந்துகொள்கிறார்.
ஆரம்பகால AI தாமதம் மற்றும் அதிகரித்த வேகத்திற்கான அவர்களின் முக்கியமான தேவையை நிவர்த்தி செய்வதன் மூலம் பெயரிடப்படாத பார்ச்சூன் 100 நிறுவனங்கள் உட்பட பல வாடிக்கையாளர்களை இன்செப்சன் ஏற்கனவே பாதுகாத்துள்ளது, எம்ரான் கூறினார்.
“நாங்கள் கண்டறிந்தது என்னவென்றால், எங்கள் மாதிரிகள் ஜி.பீ.யுகளை மிகவும் திறமையாக மேம்படுத்த முடியும்,” என்று எர்மன் கூறினார், பொதுவாக உற்பத்தியில் மாதிரிகளை இயக்க பயன்படுத்தப்படும் கணினி சில்லுகள் குறிப்பிடுகின்றன. “இது ஒரு பெரிய விஷயம் என்று நான் நினைக்கிறேன். இது மக்கள் மொழி மாதிரிகளை உருவாக்கும் முறையை மாற்றப்போகிறது. ”
தொடக்கமானது ஒரு ஏபிஐ மற்றும் ஆன்-வளாகம் மற்றும் எட்ஜ் சாதன வரிசைப்படுத்தல் விருப்பங்கள், மாடல் ஃபைன்-ட்யூனிங்கிற்கான ஆதரவு மற்றும் பல்வேறு பயன்பாட்டு நிகழ்வுகளுக்கான பாக்ஸ்-க்கு வெளியே டிஎல்எம்களின் தொகுப்பு ஆகியவற்றை வழங்குகிறது. அதன் டி.எல்.எம் கள் பாரம்பரிய எல்.எல்.எம் -களை விட 10 எக்ஸ் வேகமாக இயங்க முடியும் என்று நிறுவனம் கூறுகிறது, அதே நேரத்தில் 10 எக்ஸ் குறைவாக செலவாகும்.
“எங்கள் ‘சிறிய’ குறியீட்டு மாதிரியானது (ஓபனாயின்) ஜிபிடி -4 ஓ மினி போலவே சிறந்தது, அதே நேரத்தில் 10 மடங்கு வேகமாக வேகமாக இருக்கும்” என்று ஒரு நிறுவனத்தின் செய்தித் தொடர்பாளர் டெக் க்ரஞ்சிடம் கூறினார். “எங்கள் ‘மினி’ மாடல் (மெட்டாவின்) லாமா 3.1 8 பி போன்ற சிறிய திறந்த மூல மாடல்களை விஞ்சி, வினாடிக்கு 1,000 டோக்கன்களை அடைகிறது.”
“டோக்கன்கள்” என்பது மூல தரவுகளின் பிட்களுக்கான தொழில் பேச்சுவழக்கு. வினாடிக்கு ஆயிரம் டோக்கன்கள் உண்மையில் ஒரு சுவாரஸ்யமான வேகம்தொடக்கத்தின் கூற்றுக்கள் உள்ளன என்று கருதி.