ગૂગલ એઆઈ હવે વપરાશકર્તાઓને ફોન કેમેરા સાથે 27 ભાષાઓમાં તુરંત ટેક્સ્ટનું ભાષાંતર કરવા દે છે

(GIF: ગૂગલ)

કૃત્રિમ બુદ્ધિ માટે આભાર, વિદેશ યાત્રા ક્યારેય સરળ નહોતી.

ગૂગલ ટ્રાન્સલેટ એપ્લિકેશન વપરાશકર્તાઓને તરત જ ટેક્સ્ટનું ભાષાંતર કરવા દે છે. એપ્લિકેશનમાં, તમે જે ક cameraમેરો અનુવાદિત કરવા માંગો છો તેના પર ફક્ત તમારા ક cameraમેરાને દર્શાવો અને તમે જોશો કે તે તમારી ઇચ્છિત ભાષામાં જીવંત રૂપાંતરિત થાય છે, તમારી આંખોની આગળ-કોઈ ઇન્ટરનેટ કનેક્શન અથવા સેલ ફોન ડેટાની જરૂર નથી. આ સરળ સુવિધા થોડા સમય માટે ઉપલબ્ધ છે, પરંતુ તે ફક્ત સાત ભાષાઓ સાથે સુસંગત હતી. હવે , મશીન લર્નિંગના આભાર, ગૂગલે 27 ભાષાઓનો તુરંત અનુવાદ કરવા એપ્લિકેશનને અપગ્રેડ કરી છે.

તેથી, આગલી વખતે જ્યારે તમે પ્રાગમાં છો અને મેનૂ વાંચી શકતા નથી, ત્યારે અમે તમારી પીઠ મેળવી લીધી, ગૂગલમાં સોફ્ટવેર એન્જિનિયર ઓટાવિયો ગુડ, કંપનીના સંશોધન પર લખ્યું બ્લોગ .

ગૂગલે એઆઈનો ઉપયોગ ફક્ત તેમની વાણી ઓળખ ભૂલોને અડધા કાપવા માટે કર્યો હતો.

આજ મુજબ, અંગ્રેજી, ફ્રેન્ચ, જર્મન, ઇટાલિયન, પોર્ટુગીઝ, રશિયન અને સ્પેનિશ વચ્ચેના અનુવાદ ઉપરાંત, રીઅલ ટાઇમમાં પણ નીચેની 20 ભાષાઓમાં ભાષાંતર કરી શકાય છે: બલ્ગેરિયન, કતલાન, ક્રોએશિયન, ચેક, ડેનિશ, ડચ, ફિલિપિનો, ફિનિશ, હંગેરિયન, ઇન્ડોનેશિયન, લિથુનિયન, નોર્વેજીયન, પોલિશ, રોમાનિયન, સ્લોવાક, સ્વીડિશ, ટર્કીશ અને યુક્રેનિયન. અને જો તમે ટેક્સ્ટ ટ્રાન્સલેશનને લાઇવ જોવાની જગ્યાએ કોઈ તસવીર લેવાનું પસંદ કરો છો, તો કુલ languages supported ભાષાઓને સમર્થન આપવામાં આવ્યું છે.

તો કેવી રીતે ગૂગલ ઉપલબ્ધ ભાષાઓની સંખ્યા વધારવામાં સક્ષમ હતું? તેઓએ પહેલા વર્ડ લેન્સ, અગાઉ એક વૃદ્ધિ પામતી વાસ્તવિકતા અનુવાદ એપ્લિકેશન, હસ્તગત કરી અને એપ્લિકેશનની ક્ષમતાઓને વધારવા માટે મશીન લર્નિંગ અને કન્વોલિશનલ ન્યુરલ નેટવર્કનો ઉપયોગ કર્યો. છબી માન્યતાની પ્રગતિઓ કી હતી.

પાંચ વર્ષ પહેલાં, જો તમે કમ્પ્યુટરને બિલાડી અથવા કૂતરાની છબી આપો, તો તે કઈ છે તે કહેવામાં તકલીફ પડી. શ્રી ગુડએ જણાવ્યું હતું કે, કોન્વોલ્યુશનલ ન્યુરલ નેટવર્ક માટે આભાર, કમ્પ્યુટર બિલાડી અને કૂતરા વચ્ચેનો તફાવત જ કહી શકશે નહીં, તેઓ કૂતરાઓની વિવિધ જાતિઓને પણ ઓળખી શકે છે. હા, તેઓ માત્ર કરતાં વધુ માટે સારા છે ટ્રિપી કલા You જો તમે કોઈ વિદેશી મેનૂનું ભાષાંતર કરી રહ્યાં છો અથવા ગૂગલની ભાષાંતર એપ્લિકેશનના નવીનતમ સંસ્કરણ સાથે સાઇન ઇન કરો છો, તો તમે હવે ઠંડા ન્યુરલ નેટનો ઉપયોગ કરી રહ્યાં છો.

ઉત્તરોત્તર

પ્રથમ , અનુવાદમાં પૃષ્ઠભૂમિની ગડબડી કા weવી અને ટેક્સ્ટને સ્થિત કરવું આવશ્યક છે. જ્યારે તે સમાન રંગના પિક્સેલ્સના બ્લોબ્સને સ્થિત કરે છે, ત્યારે તે નક્કી કરે છે કે તેઓ અક્ષરો છે. અને જ્યારે તે બ્લોબ્સ એકબીજાની નજીક હોય છે, ત્યારે તે સમજી જાય છે કે તે વાંચવાની સતત લાઇન છે.

આગળ, એપ્લિકેશનને દરેક વ્યક્તિગત અક્ષર શું છે તે ઓળખવું આવશ્યક છે. અહીંથી deepંડા શિક્ષણ આવે છે.

અમે કન્વોલિશનલ ન્યુરલ નેટવર્કનો ઉપયોગ કરીએ છીએ, તેને અક્ષરો અને બિન-અક્ષરો પર તાલીમ આપીએ છીએ જેથી તે જુદી જુદી અક્ષરો કેવા લાગે છે તે શીખી શકે, બ્લોગ પોસ્ટ વાંચે છે.

સંશોધનકારોએ સોફટવેરને માત્ર સ્વચ્છ દેખાતા પત્રો જ નહીં, પણ ગંદા પત્રોનો ઉપયોગ કરીને તાલીમ લેવી પડી હતી. શ્રી ગુડએ લખ્યું, વાસ્તવિક વિશ્વમાં પત્રો પ્રતિબિંબ, ગંદકી, ધૂમ્રપાન અને તમામ પ્રકારના વિચિત્રતા દ્વારા અવરોધિત થાય છે. તેથી અમે વાસ્તવિક વિશ્વના ઘોંઘાટની ખાતરીપૂર્વક નકલ કરવા માટે તમામ પ્રકારની નકલી ગંદકી બનાવવા માટે અમારા લેટર જનરેટર બનાવ્યાં છે - ચારે બાજુ નકલી પ્રતિબિંબ, નકલી બનાવટી, નકલી વિચિત્રતા.

તાલીમ માટે ઉપયોગમાં લેવામાં આવતા કેટલાક ગંદા પત્રો. (ફોટો: ગૂગલ)

આ ત્રીજું પગલાં અનુવાદો મેળવવા માટે શબ્દકોશમાં માન્ય અક્ષરો શોધી રહ્યાં છે. અને ચોકસાઈના વધારાના પ્રયત્નો માટે, જો એસ 5 તરીકે ખોટી રીતે વાંચવામાં આવે તો ડિક્શનરી લુકઅપ્સ આશરે હોય છે.

છેલ્લે, અનુવાદિત ટેક્સ્ટ મૂળની ટોચ પર સમાન શૈલીમાં રેન્ડર કરવામાં આવે છે.

અમે આ કરી શકીએ છીએ કારણ કે અમે પહેલાથી જ છબીમાં અક્ષરો શોધી અને વાંચ્યા છે, તેથી આપણે જાણીએ છીએ કે તેઓ ક્યાં છે. આપણે અક્ષરોની આજુબાજુના રંગો જોઈ શકીએ છીએ અને તેનો ઉપયોગ મૂળ અક્ષરો ભૂંસી નાખવા માટે કરી શકીએ છીએ. અને પછી અમે મૂળ અગ્રભૂમિ રંગનો ઉપયોગ કરીને ટોચ પર અનુવાદ દોરી શકીએ છીએ, બ્લોગ પોસ્ટ વાંચે છે.

શક્ય તેટલું કાર્યક્ષમ રહેવા અને ઇન્ટરનેટ અથવા ડેટા કનેક્શન વિના આ બધા પગલાઓને વાસ્તવિક સમયમાં પૂર્ણ કરવાની મંજૂરી આપવા માટે, ગૂગલ ટીમે તે સંભાળતી માહિતીની ઘનતા પર anપર બાઉન્ડ સાથે એક ખૂબ જ નાના ન્યુરલ નેટ વિકસાવી છે. કારણ કે તેઓ પોતાનો તાલીમ ડેટા ઉત્પન્ન કરી રહ્યા હતા, તેથી સાચા ડેટાને શામેલ કરવો મહત્વપૂર્ણ હતું પરંતુ વધારાના કંઇ નહીં તેથી ન્યુરલ નેટવર્ક મહત્વપૂર્ણ માહિતી પર તેની માહિતીની ઘનતાનો વધુ ઉપયોગ કરી રહ્યું નથી. તેનું ઉદાહરણ એ હશે કે તેને પરિભ્રમણની થોડી માત્રાવાળા પત્રને કેવી રીતે ઓળખવાની જરૂર છે, પરંતુ ખૂબ નહીં.

અંતે, વપરાશકર્તાઓને વધુ 20 ભાષાઓ બાકી છે પરંતુ તે જ ઝડપી ગતિ.

આ પણ જુઓ: ગૂગલની એઆઈ ટીમે તેમના મશીન લર્નિંગ રિસર્ચ પર અમને ડાઉનડાઉન આપ્યું

ગૂગલ એઆઈ વપરાશકર્તાઓને ફોન કેમેરા સાથે 27 ભાષાઓમાં તુરંત ટેક્સ્ટનું ભાષાંતર કરવા દે છે

ઉત્તરોત્તર

લેખ કે જે તમને ગમશે :

સ્ટાર્ટઅપ પાવરિંગ ઓલ-ડિજિટલ શ ofઝના ક્લોઝર પર પાયોનિયર વીઆર કોમિક ડંકન ટ્રસેલ

તમે તે વાઈરલને કાdenી શકો છો ‘જેડેન કે સ્મિથ’ ફેસબુક સંદેશને કોઈ દોષ નહીં અનુભવે

આ પણ જુઓ:

પીટર જેક્સન હવે એમેઝોનની ‘લોર્ડ ઓફ ધ રિંગ્સ’ સિરીઝમાં શામેલ છે (સ Sર્ટ ઓફ)

બર્જનિંગ પગાર કેલ્ક્યુલેટર પે સિક્રેસીને મારી રહ્યા છે! અને તમને વધારો કરવામાં સહાય કરી શકે છે!

ના, તે ‘યલોસ્ટોન’ જેવું લાગતું નથી નેટફ્લિક્સ પર આવી રહ્યું છે

બર્ડન પાર્ટી પ Padડ વેચે છે

એએમસીના ‘ટર્ન’ પર ક્રાંતિકારક જાસૂસ વગાડવાના પડકારો પર જેમી બેલ

ડબલ્યુએએસપી દ્વારા અટવાયેલું! તેમ છતાં, હું પામ બીચ પ્રેમ કરું છું

‘લા લા લેન્ડ’ / ‘મૂનલાઇટ’ મેશઅપ સાબિત કરે છે ‘પ્રામાણિક ટ્રેઇલર્સ’ શ્રેષ્ઠ યુટ્યુબ સિરીઝ છે