गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स
आप सभी गूगल gemini का इस्तेमाल तो करते ही होंगे लेकिन क्या आप यह जानते कि अभी हाल ही में उसमें एक अपडेट आया है जिसके वजह से अब आप बोलकर भी आसानी से बातचीत कर सकते हैं।
गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स
गूगल ने हाल ही में अपने जेमिनी एआई मॉडल के लाइव एपीआई में एक शानदार अपडेट दिया है जिसमें ऑडियो मॉडल को शामिल किया गया है। अब आप इसमें पहले से भी बेहतर तरीके से बातचीत कर पाएंगे और आपका काम पहले से भी ज्यादा आसान हो जाएगा इसके बारे में डिटेल्स में हम आपको इस आर्टिकल में बताते हैं।
ऑडियो मॉडल में क्या है खास
यह ऑडियो मॉडल जेमिनी 2.5 फ्लैश पर आधारित है जो लाइव एपीआई के जरिए नैचुरल साउंडिंग वॉइस जेनरेट करता है। यह मॉडल 30 से ज्यादा हाई-डेफिनिशन वॉइस ऑप्शंस और 24 से अधिक भाषाओं का सपोर्ट करता है। यह पुराने टेक्स्ट-टू-स्पीच सिस्टम्स से अलग है और यह सीधे ऑडियो आउटपुट पैदा करता है।
लाइव एपीआई का मज़ा
जेमिनी लाइव एपीआई पहले से ही रीयल-टाइम वॉइस और वीडियो इंटरैक्शंस को सपोर्ट करता था लेकिन इस नए मॉडल के साथ यह और स्ट्रांग हो गया है। यह अपडेट प्रीव्यू मोड में उपलब्ध है जो डेवलपर्स को टेस्ट करने का मौका देता है। गूगल का कहना है कि यह बदलाव वॉइस एजेंट्स को और बेहतरीन बनाता है।
पहले से ज्यादा लगेगा नेचुरल
अब जेमिनी मॉडल बातचीतों को और ज्यादा नेचुरल बना सकता है। यह इंटरप्शंस, पॉज और साइड कन्वर्सेशंस को बेहतर तरीके से हैंडल करता है। इससे उपयोगकर्ता को लगता है जैसे वे किसी दोस्त से बात कर रहे हों। इससे यूजर जल्दी बोर भी नहीं होता है और उसे बात करने में मजा भी आता है।
READ MORE - AOC Gaming Monitor AG326UCG से छाई गेमर्स में खुशी की लहर मिलेंगे कई गेमिंग मोड्स
अफेक्टिव डायलॉग फीचर
इस मॉडल की सबसे रोचक फीचर है अफेक्टिव डायलॉग जो यूजर की भावनाओं को पहचानकर रिएक्शन देता है। अगर आप गुस्से में बोलें या खुशी से तो जेमिनी उसी के अनुसार टोन एडजस्ट कर लेगा। यह फीचर नैचुरल कन्वर्सेशंस को गहराई देता है जैसे कि मॉडल वाकई में आपकी फीलिंग्स को समझ रहा हो।
प्रोएक्टिव ऑडियो फीचर
प्रोएक्टिव ऑडियो फीचर मॉडल को बैकग्राउंड नॉइज या इररेलेवेंट बातों को इग्नोर करने की कैपेसिटी देता है। यह केवल तभी रिस्पॉन्ड करता है जब बातचीत सीधे जुड़ी हो। इससे फालतू के इंटरप्शंस रुक जाते हैं और कन्वर्सेशन ज्यादा फोकस्ड रहती है। अगर आप शोरगुल वाले माहौल में है तो भी आपको बहुत ही बेहतर रिस्पॉन्स मिलेगा।
मिलेगा मल्टीलिंगुअल सपोर्ट
नया मॉडल 24 से ज्यादा भाषाओं में सीधे काम करता है। आप हिंदी में शुरू करें और अचानक इंग्लिश स्विच कर दें जेमिनी बिना रुके फॉलो कर लेगा। यह फीचर ग्लोबल ऐप्स के लिए बढ़िया है जहां यूजर्स अलग-अलग भाषाओं में बात करते हैं। ट्रांसक्रिप्शन की एक्यूरेसी भी बेहतर हो गई है जिससे गलतियां कम होती हैं।
लाइव डाटा मिलेगा अब आसान से
इस अपडेट के साथ फंक्शन कॉलिंग को और मजबूत किया गया है जो मॉडल को रीयल-टाइम डेटा सोर्सेस जैसे गूगल सर्च से जोड़ता है। डेवलपर्स अब कस्टम टूल्स इंटीग्रेट कर सकते हैं जिससे कन्वर्सेशंस ज्यादा प्रैक्टिकल बन जाती हैं।
लायेगा कई एप्लीकेशंस में बदलाव
यह मॉडल वर्चुअल असिस्टेंट्स, एजुकेशनल टूल्स और कस्टमर सर्विस बॉट्स के लिए गेम-चेंजर साबित हो सकता है। यह कई फील्ड के लिए बहुत ही ज्यादा फायदेमंद साबित होगा। फिर चाहे वह हेल्थ केयर का फील्ड हो या फिर किसी भी स्टूडेंट के पढ़ाई का फील्ड हो।
READ MORE - सोनी ने लिमिटेड एडिशन ड्यूअलसेंस वायरलेस कंट्रोलर लॉन्च 3 अक्टूबर से होंगे प्री-ऑर्डर शुरू