OpenAI Kenalkan GPT-Realtime-2, Teknologi AI Suara Super Cepat dan Canggih

Ditulis oleh kabarpemerintah.com - 15 May 2026 00:06

FOTO: Open AI kembali membuat gebrakan di dunia teknologi dengan meluncurkan model kecerdasan buatan berbasis suara terbaru bernama GPT-Realtime-2 Dok. Kabarpemerintah.com

JAKARTA, KabarPemerintah.com - OpenAI kembali membuat gebrakan di dunia teknologi dengan meluncurkan model kecerdasan buatan berbasis suara terbaru bernama GPT-Realtime-2. Teknologi anyar ini diklaim mampu menghadirkan percakapan suara yang lebih natural, cepat, dan memiliki kemampuan penalaran kompleks secara real-time.

Peluncuran tersebut diumumkan OpenAI melalui pembaruan API bertajuk “Advancing Voice Intelligence with New Models in the API” yang ditujukan bagi pengembang aplikasi berbasis suara.

Selain GPT-Realtime-2, OpenAI juga memperkenalkan dua model audio lainnya, yakni GPT-Realtime-Translate untuk penerjemahan suara lintas bahasa secara langsung serta GPT-Realtime-Whisper yang difokuskan pada transkripsi audio streaming.

Dalam pengumumannya, OpenAI menyebut ketiga model tersebut dirancang untuk mendukung generasi baru asisten suara AI, layanan pelanggan otomatis, hingga agen virtual berbasis percakapan real-time.

“Kami memperkenalkan tiga model audio di API yang membuka kelas baru aplikasi suara untuk pengembang,” tulis OpenAI dalam pernyataan resminya.

GPT-Realtime-2 disebut menjadi model audio pertama OpenAI yang membawa kemampuan penalaran setara GPT-5 ke dalam interaksi suara. Teknologi ini memungkinkan AI memahami konteks percakapan yang lebih panjang, merespons interupsi secara alami, hingga menjalankan berbagai perintah saat percakapan berlangsung.

Berbeda dengan sistem asisten suara konvensional, model terbaru ini mendukung teknologi speech-to-speech secara langsung tanpa perlu mengubah audio menjadi teks terlebih dahulu. Pendekatan tersebut membuat respons AI terasa lebih cepat dan lebih mirip percakapan manusia.

Tak hanya itu, fitur GPT-Realtime-Translate juga menjadi sorotan karena mendukung lebih dari 70 bahasa input dan 13 bahasa output secara real-time. Teknologi ini dinilai berpotensi mempermudah komunikasi lintas negara secara instan.

Sementara GPT-Realtime-Whisper difokuskan untuk kebutuhan transkripsi langsung seperti caption rapat, pencatatan otomatis, hingga dokumentasi percakapan secara live.

OpenAI mengklaim performa model terbaru mereka mengalami peningkatan signifikan dibanding generasi sebelumnya. Dalam pengujian Big Bench Audio, GPT-Realtime-2 versi high disebut mencatat skor 15,2 persen lebih tinggi dibanding GPT-Realtime-1.5.

Ketiga model tersebut kini tersedia melalui Realtime API milik OpenAI untuk para pengembang aplikasi.

Dilansir dari OpenAI, biaya penggunaan GPT-Realtime-2 dipatok sebesar US$32 per 1 juta token input audio dan US$64 per 1 juta token output audio. Sementara GPT-Realtime-Translate dikenakan biaya US$0,034 per menit dan GPT-Realtime-Whisper sekitar US$0,017 per menit.

Kehadiran teknologi baru ini diprediksi bakal mempercepat persaingan pengembangan AI suara global, terutama di sektor layanan pelanggan digital, asisten virtual, pendidikan, hingga komunikasi lintas bahasa berbasis real-time.

(RBT/MAM)

← Kembali ke Daftar