
தொழில்துறை முன்னணி AI கவரேஜில் சமீபத்திய புதுப்பிப்புகள் மற்றும் பிரத்யேக உள்ளடக்கத்திற்காக எங்கள் அன்றாட மற்றும் வாராந்திர செய்திமடல்களில் சேரவும். மேலும் அறிக
முன்னாள் பழந்திர் முன்னாள் மாணவர்களிடமிருந்து மிகவும் மதிப்புமிக்க AI குரல் குளோனிங் மற்றும் தலைமுறை தொடக்கமானது பதின்வென்லாப்ஸ் எழுத்தாளர் வி 1 தொடங்கப்பட்டதுஒரு புதிய பேச்சு-க்கு-உரை மாதிரி, இது பல மொழிகளில் மிக உயர்ந்த துல்லியத்தை அடைகிறது. பயனர்கள் அதை இங்கே முயற்சி செய்யலாம்.
நிறுவனத்தின் வரையறைகளின்படி, இது கூகிளின் ஜெமினி 2.0 ஃப்ளாஷ், ஓபன் ஏகாவின் விஸ்பர் வி 3 மற்றும் டீப் கிராம் நோவா -3 ஆகியவற்றை விஞ்சி பேசும் பேச்சை வலையில் உரையாக மாற்றியமைத்து, புதிய பதிவு-குறைந்த பிழை விகிதங்களை அடைகிறது.
99 மொழிகளில் எழுத்தாளர் அதிநவீன டிரான்ஸ்கிரிப்ஷன் துல்லியத்தை வழங்குவதாக நிறுவனம் கூறுகிறது, இதில் முன்னர் குறைந்த மொழிகளில் செர்பிய, கான்டோனீஸ் மற்றும் மலையாளம் போன்ற மேம்பட்ட செயல்திறன் அடங்கும்.
ஃபிளேவியோ ஷ்னீடராக, லெவன்லாப்ஸ் ஆராய்ச்சியாளரை வழிநடத்துகிறார் x இல் எழுதினார்எழுத்தாளர் என்பது லெவன்லாப்ஸால் இதுவரை வெளியிடப்பட்ட “புத்திசாலித்தனமான ஆடியோ புரிதல் மாதிரி” ஆகும்.
“எழுத்தாளர் மட்டும் படியெடுக்கவில்லை – அது ஆடியோவைப் புரிந்துகொள்கிறது,” ஷ்னீடர் ஒரு நூலில் தொடர்ந்தது. “இது சொற்கள் அல்லாத நிகழ்வுகளை (சிரிப்பு, ஒலி விளைவுகள், இசை மற்றும் பின்னணி இரைச்சல் போன்றவை) கண்டறிந்து, மிகவும் சவாலான சூழல்களில் கூட துல்லியமான டைரைசேஷனுக்காக நீண்ட ஆடியோ சூழல்களை பகுப்பாய்வு செய்யலாம்.”
“டைரேஷன்பேச்சாளர்களின் குரல் குணங்களால் ஒரு பதிவில் பிரிக்கும் செயல்முறைக்கு வழங்கப்பட்ட பெயர் ”.
உண்மையில், லெவன்லாப்ஸின் ஆவணங்கள் மாநில எழுத்தாளர் வேறுபடுத்தி தனிமைப்படுத்தலாம் ஒரே ஆடியோ கோப்பில் 32 வெவ்வேறு பேச்சாளர்கள்.
“நிகழ்நேர டிரான்ஸ்கிரிப்ஷனை விட உயர் துயர டிரான்ஸ்கிரிப்ஷன் தேவைப்படும்போது” எழுத்தாளர் “சிறந்த முறையில் பயன்படுத்தப்படும்போது” என்று பதின்வென்ன்லாப்ஸ் எச்சரித்தாலும், நிறுவனம் விரைவில் குறைந்த தாமத பதிப்பை அறிமுகப்படுத்த திட்டமிட்டுள்ளது, நிகழ்நேர பயன்பாடுகளுக்கான அதன் பயன்பாட்டை விரிவுபடுத்துகிறது.
மிகக் குறைந்த சொல் பிழை விகிதங்கள் (WER)
நிஜ உலக ஆடியோ சவால்களை துல்லியத்துடன் கையாள எழுத்தாளர் வடிவமைக்கப்பட்டுள்ளது. ஃப்ளூர்ஸ் மற்றும் பொதுவான குரலின் பெஞ்ச்மார்க் முடிவுகளின்படி, இது இத்தாலிய (98.7%) மற்றும் ஆங்கிலம் (96.7%) உள்ளிட்ட பல மொழிகளுக்கான மிகக் குறைந்த சொல் பிழை விகிதங்களை (WER) பதிவு செய்கிறது.
முக்கிய அம்சங்கள் பின்வருமாறு:
- மல்டி-ஸ்பீக்கர் பதிவுகளில் பேச்சாளர்களை வேறுபடுத்துவதற்கு சபாநாயகர் டைரிசேஷன்.
- விரிவான டிரான்ஸ்கிரிப்ஷன் துல்லியத்திற்கான சொல்-நிலை நேர முத்திரைகள்.
- சிரிப்பு மற்றும் பின்னணி சத்தங்கள் போன்ற பேச்சு அல்லாத நிகழ்வுகளைக் கண்டறிதல்.
- API வழியாக தடையற்ற ஒருங்கிணைப்புக்கான கட்டமைக்கப்பட்ட டிரான்ஸ்கிரிப்ட் வெளியீடு.
விலை மற்றும் கிடைக்கும் தன்மை
லெவன்லாப்ஸ் வலைத்தளம் மற்றும் ஏபிஐ மூலம் எழுத்தாளர் இப்போது கிடைக்கிறது.
விலை உள்ளீட்டு ஆடியோவின் ஒரு மணி நேரத்திற்கு 40 0.40 ஆக நிர்ணயிக்கப்பட்டுள்ளது, அடுத்த ஆறு வாரங்களுக்கு 50% தள்ளுபடி. நிகழ்நேர பயன்பாடுகளுக்கான குறைந்த தாமத பதிப்பும் வளர்ச்சியில் உள்ளது.
நிறுவனங்களுக்கு என்ன அர்த்தம்
நிறுவன முடிவெடுப்பவர்களைப் பொறுத்தவரை, ஸ்க்ரிப் அளவிடக்கூடிய, அதிக துல்லியமான டிரான்ஸ்கிரிப்ஷனுக்கான ஒரு கருவியை முன்வைக்கிறது, இது தானியங்கி ஆவணங்கள், சந்திப்பு டிரான்ஸ்கிரிப்ஷன் மற்றும் உள்ளடக்க அணுகல் ஆகியவற்றை நம்பியிருக்கும் தொழில்களுக்கு பயனுள்ளதாக இருக்கும்.
மாறுபட்ட மொழிகளை அதிக துல்லியத்துடன் கையாளும் மாதிரியின் திறன் பன்னாட்டு வணிகங்கள், ஊடக நிறுவனங்கள் மற்றும் வாடிக்கையாளர் ஆதரவு பயன்பாடுகளுக்கு பயனளிக்கிறது.
எழுத்தாளரின் விலை நிர்ணயம் அதிக அளவிலான டிரான்ஸ்கிரிப்ஷன் சேவைகள் தேவைப்படும் வணிகங்களுக்கு போட்டியிடும், மேலும் அதன் ஏபிஐ அடிப்படையிலான ஒருங்கிணைப்பு நிறுவன பணிப்பாய்வுகளில் தடையற்ற தத்தெடுப்புக்கு அனுமதிக்கிறது.
கூடுதலாக, வரவிருக்கும் குறைந்த தாமத பதிப்பு நிகழ்நேர தகவல்தொடர்பு கருவிகளுக்கு எழுத்தாளரை ஒரு சாத்தியமான விருப்பமாக நிலைநிறுத்தக்கூடும்.
போட்டி ஹ்யூமின் எதிர் உரை-க்கு-பேச்சு மாதிரி ஆக்டேவ் அதே நாளில் வருகிறது
நேரம் எல்லாமே, மற்றும் லெவன்லாப்ஸ் போட்டியாளரான ஹ்யூம் AI ஐ வெளியிட்ட அதே நாளில் எழுத்தாளரைத் தொடங்கத் தேர்வுசெய்தது, இது எல்.எல்.எம்-இயங்கும் உரை-க்கு-பேச்சு மாதிரியாகும், இது சரிசெய்யக்கூடிய உணர்ச்சிகளுடன் AI- உருவாக்கிய குரல்களைத் தனிப்பயனாக்க பயனர்களை அனுமதிக்கிறது.
இது ஆடியோபுக்குகள், பாட்காஸ்ட்கள் மற்றும் வீடியோ கேம் குரல்வழிகள் உள்ளிட்ட உள்ளடக்க உருவாக்கத்திற்காக வடிவமைக்கப்பட்டுள்ளது. நிலையான டி.டி.எஸ் அமைப்புகளைப் போலன்றி, ஆக்டேவ் தனிப்பட்ட வாக்கியங்களுக்கு அப்பாற்பட்ட சூழலைக் கருதுகிறார், தொனி, தாளத்தை சரிசெய்தல் மற்றும் மிகவும் இயல்பானதாக மாறும்.
லெவன்லாப்ஸின் உரை-க்கு-பேச்சு பிரசாதங்களுக்கு நேரடி போட்டியாளராக ஹியூம் AI ஆக்டேவை நிலைநிறுத்துகிறது, ஆக்டேவின் விலை நிர்ணயத்தின் தற்போதைய AI குரல் சேவைகளின் செலவில் பாதி செலவாகும் என்பதை எடுத்துக்காட்டுகிறது.
எழுத்தாளர் மற்றும் ஆக்டேவ் வெவ்வேறு செயல்பாடுகளுக்கு சேவை செய்யும் போது, அவற்றின் வளர்ச்சி AI- இயக்கப்படும் ஆடியோ மாதிரிகளில் வளர்ந்து வரும் போட்டியை பிரதிபலிக்கிறது.
லெவன்லாப்ஸ் துல்லியமான, பல மொழி பேச்சு அங்கீகாரத்திற்கு முன்னுரிமை அளிக்கிறது, அதே நேரத்தில் ஹியூம் AI வெளிப்படையான AI- உருவாக்கிய பேச்சை முன்னேற்றுகிறது.
நிறுவனங்களைப் பொறுத்தவரை, டிரான்ஸ்கிரிப்ஷன் மற்றும் செயற்கை குரல் பயன்பாடுகள் இரண்டிற்கும் மிகவும் சிறப்பு வாய்ந்த தீர்வுகள், மேலும் திறமையான உள்ளடக்க உற்பத்தி, வாடிக்கையாளர் ஈடுபாடு மற்றும் அணுகல் கருவிகளை செயல்படுத்துகின்றன.
எழுத்தாளர் இப்போது நேரலையில் இருக்கிறார், லெவன்லாப்ஸ் அடுத்த வாரம் ஒரு மெய்நிகர் நிகழ்வை அதன் வளர்ச்சியின் பின்னணியில் அணியுடன் நடத்துகிறது. மேலும் விவரங்கள், வரையறைகள் மற்றும் ஏபிஐ ஆவணங்கள் அதிகாரியில் கிடைக்கின்றன வலைப்பதிவு இடுகை.
ஆதாரம்