गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स
आप सभी गूगल gemini का इस्तेमाल तो करते ही होंगे लेकिन क्या आप यह जानते कि अभी हाल ही में उसमें एक अपडेट आया है जिसके वजह से अब आप बोलकर भी आसानी से बातचीत कर सकते हैं।
Vandana Rajput Verified Public Figure • 27 Mar, 2026Journalist
Sep 27, 2025 • 9:49 PM
N
News TV India
BREAKING
Vandana Rajput
8 months ago
गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स
आप सभी गूगल gemini का इस्तेमाल तो करते ही होंगे लेकिन क्या आप यह जानते कि अभी हाल ही में उसमें एक अपडेट आया है जिसके वजह से अब आप बोलकर भी आसानी से बातचीत कर सकते हैं।
Full Story: https://www.newstvindia.in/google-adds-audio-model-to-live-api-of-gemini-ai-model-know-details
गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स
गूगल ने हाल ही में अपने जेमिनी एआई मॉडल के लाइव एपीआई में एक शानदार अपडेट दिया है जिसमें ऑडियो मॉडल को शामिल किया गया है। अब आप इसमें पहले से भी बेहतर तरीके से बातचीत कर पाएंगे और आपका काम पहले से भी ज्यादा आसान हो जाएगा इसके बारे में डिटेल्स में हम आपको इस आर्टिकल में बताते हैं।
यह ऑडियो मॉडल जेमिनी 2.5 फ्लैश पर आधारित है जो लाइव एपीआई के जरिए नैचुरल साउंडिंग वॉइस जेनरेट करता है। यह मॉडल 30 से ज्यादा हाई-डेफिनिशन वॉइस ऑप्शंस और 24 से अधिक भाषाओं का सपोर्ट करता है। यह पुराने टेक्स्ट-टू-स्पीच सिस्टम्स से अलग है और यह सीधे ऑडियो आउटपुट पैदा करता है।
क्या आप WhatsApp पर न्यूज़ अपडेट पाना चाहते हैं?
WhatsApp पर ताज़ा और भरोसेमंद न्यूज़ अपडेट तुरंत पाएं। अभी जुड़ें और हर खबर सबसे पहले पढ़ें।
जेमिनी लाइव एपीआई पहले से ही रीयल-टाइम वॉइस और वीडियो इंटरैक्शंस को सपोर्ट करता था लेकिन इस नए मॉडल के साथ यह और स्ट्रांग हो गया है। यह अपडेट प्रीव्यू मोड में उपलब्ध है जो डेवलपर्स को टेस्ट करने का मौका देता है। गूगल का कहना है कि यह बदलाव वॉइस एजेंट्स को और बेहतरीन बनाता है।
पहले से ज्यादा लगेगा नेचुरल
अब जेमिनी मॉडल बातचीतों को और ज्यादा नेचुरल बना सकता है। यह इंटरप्शंस, पॉज और साइड कन्वर्सेशंस को बेहतर तरीके से हैंडल करता है। इससे उपयोगकर्ता को लगता है जैसे वे किसी दोस्त से बात कर रहे हों। इससे यूजर जल्दी बोर भी नहीं होता है और उसे बात करने में मजा भी आता है।
इस मॉडल की सबसे रोचक फीचर है अफेक्टिव डायलॉग जो यूजर की भावनाओं को पहचानकर रिएक्शन देता है। अगर आप गुस्से में बोलें या खुशी से तो जेमिनी उसी के अनुसार टोन एडजस्ट कर लेगा। यह फीचर नैचुरल कन्वर्सेशंस को गहराई देता है जैसे कि मॉडल वाकई में आपकी फीलिंग्स को समझ रहा हो।
प्रोएक्टिव ऑडियो फीचर
प्रोएक्टिव ऑडियो फीचर मॉडल को बैकग्राउंड नॉइज या इररेलेवेंट बातों को इग्नोर करने की कैपेसिटी देता है। यह केवल तभी रिस्पॉन्ड करता है जब बातचीत सीधे जुड़ी हो। इससे फालतू के इंटरप्शंस रुक जाते हैं और कन्वर्सेशन ज्यादा फोकस्ड रहती है। अगर आप शोरगुल वाले माहौल में है तो भी आपको बहुत ही बेहतर रिस्पॉन्स मिलेगा।
मिलेगा मल्टीलिंगुअल सपोर्ट
नया मॉडल 24 से ज्यादा भाषाओं में सीधे काम करता है। आप हिंदी में शुरू करें और अचानक इंग्लिश स्विच कर दें जेमिनी बिना रुके फॉलो कर लेगा। यह फीचर ग्लोबल ऐप्स के लिए बढ़िया है जहां यूजर्स अलग-अलग भाषाओं में बात करते हैं। ट्रांसक्रिप्शन की एक्यूरेसी भी बेहतर हो गई है जिससे गलतियां कम होती हैं।
लाइव डाटा मिलेगा अब आसान से
इस अपडेट के साथ फंक्शन कॉलिंग को और मजबूत किया गया है जो मॉडल को रीयल-टाइम डेटा सोर्सेस जैसे गूगल सर्च से जोड़ता है। डेवलपर्स अब कस्टम टूल्स इंटीग्रेट कर सकते हैं जिससे कन्वर्सेशंस ज्यादा प्रैक्टिकल बन जाती हैं।
लायेगा कई एप्लीकेशंस में बदलाव
यह मॉडल वर्चुअल असिस्टेंट्स, एजुकेशनल टूल्स और कस्टमर सर्विस बॉट्स के लिए गेम-चेंजर साबित हो सकता है। यह कई फील्ड के लिए बहुत ही ज्यादा फायदेमंद साबित होगा। फिर चाहे वह हेल्थ केयर का फील्ड हो या फिर किसी भी स्टूडेंट के पढ़ाई का फील्ड हो।
My name is Vandana Raghav. I live in Jodhpur. I have done B.Sc. , B.ed and M.Sc. I like to give information related to tech , education , finance , Gaming and many fields . I have more than 5 years experience in this field.