വ്യത്യസ്ത ഭാഷകൾ സംസാരിക്കുന്ന ആളുകൾ തമ്മിലുള്ള ആശയവിനിമയം കൂടുതൽ എളുപ്പമാക്കുന്നതിനായി വിപ്ലവകരമായ സാങ്കേതികവിദ്യയുമായി എത്തിയിരിക്കുകയാണ് പ്രമുഖ ആഗോള കമ്പനിയായ ഗൂഗിൾ. സംഭാഷണങ്ങൾ തത്സമയം മറ്റ് ഭാഷകളിലേക്ക് വിവർത്തനം ചെയ്യാൻ സഹായിക്കുന്ന 'ജെമിനി 3.5 ലൈവ് ട്രാൻസ്ലേറ്റ്' (Gemini 3.5 Live Translate) എന്ന അത്യാധുനിക ഓഡിയോ മോഡൽ കമ്പനി ഔദ്യോഗികമായി പുറത്തിറക്കി. എഴുപതിലധികം ആഗോള ഭാഷകളെ പിന്തുണയ്ക്കുന്നതാണ് ഈ പുതിയ സംവിധാനം.
സാധാരണയായി നിലവിലുള്ള വോയ്സ് ട്രാൻസ്ലേഷൻ ടൂളുകളിൽ ഒരാൾ സംസാരിച്ച് നിർത്തിയ ശേഷം മാത്രമാണ് വിവർത്തനം ലഭ്യമാകാറുള്ളത്. ഇത് പലപ്പോഴും സംഭാഷണങ്ങൾക്കിടയിൽ അനാവശ്യമായ കാലതാമസവും വിരസതയും ഉണ്ടാക്കാറുണ്ട്. എന്നാൽ ഗൂഗിളിന്റെ പുതിയ ജെമിനി മോഡൽ ഒരാൾ സംസാരിച്ചുകൊണ്ടിരിക്കുമ്പോൾ തന്നെ തത്സമയം തടസ്സമില്ലാതെ വിവർത്തനം നിർവ്വഹിക്കും എന്നത് വലിയൊരു സവിശേഷതയാണ്.
സംസാരിക്കുന്ന വ്യക്തിയുടെ ശബ്ദത്തിന്റെ ഗാംഭീര്യം, വേഗത, തരംഗം (Intonation, Pacing, Pitch) എന്നിവ ഒട്ടും ചോർന്നുപോകാതെ അതേപടി നിലനിർത്തിക്കൊണ്ടാണ് പുതിയ സംവിധാനം വിവർത്തനം ചെയ്യുന്നത്. ഇത് വിവർത്തനം ചെയ്യപ്പെടുന്ന ഓഡിയോയ്ക്ക് ഒരു റോബോട്ടിക് ഭാവത്തിന് പകരം തികച്ചും സ്വാഭാവികമായ മനുഷ്യശബ്ദം നൽകാൻ സഹായിക്കുമെന്ന് ഗൂഗിൾ വ്യക്തമാക്കുന്നു. സങ്കീർണ്ണമായ പശ്ചാത്തല ശബ്ദങ്ങളെയും കോലാഹലങ്ങളെയും ഫിൽട്ടർ ചെയ്യാനുള്ള ശേഷിയും ഇതിനുണ്ട്.
ഗൂഗിൾ ട്രാൻസ്ലേറ്റ് ആപ്ലിക്കേഷൻ വഴി ആൻഡ്രോയിഡ്, ഐഒഎസ് ഉപഭോക്താക്കൾക്ക് ഈ പുതിയ ഫീച്ചർ ഇപ്പോൾ മുതൽ ആഗോളതലത്തിൽ ലഭ്യമായിത്തുടങ്ങിയിട്ടുണ്ട്. ഹെഡ്ഫോണുകൾ കണക്ട് ചെയ്ത് ഉപയോഗിക്കുമ്പോൾ വളരെ മികച്ച അനുഭവമായിരിക്കും ഇത് സമ്മാനിക്കുക. അതോടൊപ്പം ആൻഡ്രോയിഡ് ഉപഭോക്താക്കൾക്കായി പ്രത്യേകമായി 'ലിസണിംഗ് മോഡ്' (Listening Mode) എന്ന പുതിയ സംവിധാനവും ഗൂഗിൾ ഒരുക്കിയിട്ടുണ്ട്.
ഈ ലിസണിംഗ് മോഡ് ഓൺ ചെയ്യുന്നതിലൂടെ ഹെഡ്ഫോണുകൾ ഇല്ലെങ്കിൽ പോലും ഫോൺ സാധാരണ കോൾ ചെയ്യുന്നത് പോലെ ചെവിയോട് ചേർത്തുപിടിച്ച് വിവർത്തനം കേൾക്കാൻ സാധിക്കും. ഔദ്യോഗിക മീറ്റിംഗുകൾക്കും അന്താരാഷ്ട്ര യാത്രകൾക്കും ഈ സൗകര്യം ഏറെ പ്രയോജനപ്പെടും. ഗൂഗിൾ മീറ്റ് ഉപയോഗിക്കുന്ന കോർപ്പറേറ്റ് ഉപഭോക്താക്കൾക്കും വരും ദിവസങ്ങളിൽ ഈ സേവനം ലഭ്യമാക്കും.
ഒരു ഗൂഗിൾ മീറ്റ് കോളിൽ തന്നെ രണ്ടായിരത്തിലധികം ഭാഷാ കോമ്പിനേഷനുകളിൽ തത്സമയ വിവർത്തനം നടത്താൻ ഇതിലൂടെ സാധിക്കുമെന്നാണ് കമ്പനി അവകാശപ്പെടുന്നത്. മുൻപ് ഇത് വെറും അഞ്ച് ഭാഷകളിൽ മാത്രമായി പരിമിതപ്പെടുത്തിയിരുന്നു. ഡെവലപ്പർമാർക്കായി ഗൂഗിൾ എഐ സ്റ്റുഡിയോ വഴിയും ജെമിനി ലൈവ് എപിഐ വഴിയും ഈ മോഡലിന്റെ പബ്ലിക് പ്രിവ്യൂ ലഭ്യമാക്കിയിട്ടുണ്ട്.
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് വഴി നിർമ്മിക്കുന്ന വ്യാജ ഓഡിയോകൾ തിരിച്ചറിയുന്നതിനായി വിപ്ലവകരമായ 'സിന്ത് ഐഡി' (SynthID) വാട്ടർമാർക്കിംഗ് സാങ്കേതികവിദ്യയും ഇതിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. ഈ മോഡൽ നിർമ്മിക്കുന്ന എല്ലാ ഓഡിയോകൾക്കും ഉള്ളിൽ ഒരു അദൃശ്യമായ സിഗ്നൽ അടങ്ങിയിരിക്കും. ഇത് എഐ ദുരുപയോഗം ചെയ്യുന്നത് തടയാനും സുരക്ഷ വർദ്ധിപ്പിക്കാനും സഹായിക്കുമെന്ന് ഗൂഗിൾ പ്രൊഡക്ട് വിഭാഗം വ്യക്തമാക്കി.
ഇന്റർനെറ്റ് ലോകത്ത് പ്രതിമാസം ഒരു ട്രില്യണിലധികം വാക്കുകളാണ് ഗൂഗിൾ നിലവിൽ വിവർത്തനം ചെയ്യുന്നത്. കഴിഞ്ഞ രണ്ട് പതിറ്റാണ്ടുകളായി മെഷീൻ ലേണിംഗ് രംഗത്ത് നടത്തിയ ഗവേഷണങ്ങളുടെ ഏറ്റവും വലിയ വിജയമായാണ് ഈ പുതിയ ജെമിനി അപ്ഡേറ്റിനെ ലോകം വീക്ഷിക്കുന്നത്. ഭാഷാപരമായ തടസ്സങ്ങൾ പൂർണ്ണമായി ഇല്ലാതാക്കാൻ പുതിയ സാങ്കേതിക വിദ്യയ്ക്ക് സാധിക്കുമെന്നാണ് വിലയിരുത്തൽ.
English Summary:
Google has rolled out Gemini 3.5 Live Translate offering near real time speech to speech translation in over 70 languages while preserving the original speaker voice tone and pacing.
Tags:
Malayalam News, News Malayalam, Latest Malayalam News, Vachakam News, Technology News, Google Gemini 3.5 Live Translate, AI Voice Translation Malayalam
വാചകം ന്യൂസ് വാട്ട്സ് ആപ്പ് ഗ്രൂപ്പിൽ പങ്കാളിയാകുവാൻ
ഇവിടെ ക്ലിക്ക് ചെയ്യുക
.
വാട്സ്ആപ്പ്:ചാനലിൽ അംഗമാകാൻ ഇവിടെ ക്ലിക്ക് ചെയ്യുക .
ഫേസ്ബുക് പേജ് ലൈക്ക് ചെയ്യാൻ ഈ ലിങ്കിൽ (https://www.facebook.com/vachakam/) ക്ലിക്ക് ചെയ്യുക.
യൂട്യൂബ് ചാനൽ:വാചകം ന്യൂസ്
