OpenAI menandatangani kesepakatan untuk melatih AI pada data Reddit

OpenAI telah mencapai kesepakatan dengan Reddit untuk menggunakan data situs berita sosial tersebut untuk melatih model AI.

Dalam sebuah pos blog di situs hubungan pers OpenAI, perusahaan mengatakan bahwa kemitraan Reddit akan memberikannya akses ke konten "real-time, terstruktur, dan unik" - misalnya posting dan balasan - dari Reddit, memungkinkan alat dan modelnya untuk "mengerti dan menampilkan" konten tersebut. Konten Reddit akan dimasukkan ke dalam ChatGPT, AI percakapan populer OpenAI, dan perusahaan akan bekerja sama untuk membawa fitur "AI baru" yang tidak ditentukan kepada pengguna Reddit dan moderator.

OpenAI juga akan menjadi mitra periklanan Reddit.

"Reddit akan membangun platform model AI OpenAI untuk mewujudkan visinya yang kuat," tulis OpenAI dalam pos tersebut. "Menggunakan LLMs, ML, dan AI memungkinkan Reddit untuk meningkatkan pengalaman pengguna bagi semua orang."

OpenAI memiliki beberapa kesepakatan lisensi serupa dengan penyedia konten mulai dari perpustakaan media stok hingga penerbit berita. Namun, sudut pandang yang tidak biasa dari ini adalah bahwa Sam Altman, CEO OpenAI, memiliki saham 8,7% di Reddit, menjadikannya pemegang saham terbesar ketiga, dan pernah menjadi anggota dewan direksi perusahaan tersebut.

Dalam upaya untuk mengurangi pemeriksaan, OpenAI mengatakan dalam rilis persnya bahwa, sementara Altman tetap menjadi pemegang saham Reddit, kemitraan tersebut "dipegang oleh COO OpenAI [Brad Lightcap]" dan "disetujui oleh [dewan direksi independen OpenAI]." (Saya akan mencatat di sini bahwa Altman adalah anggota dewan OpenAI; namun, seorang juru bicara OpenAI memberitahu TechCrunch bahwa dia menarik diri dari keputusan ini.)

Reddit telah menjadikan kesepakatan lisensi data semakin menjadi bagian sentral dari strategi pertumbuhannya saat menjelajahi pasar sebagai perusahaan publik.

Dalam prospektus IPO-nya, Reddit mengungkapkan bahwa memiliki kesepakatan kontraktual untuk melisensikan data kepada pelanggan termasuk Google dengan nilai gabungan lebih dari $200 juta. Dan, dalam laporan pendapatan pertamanya sebagai perusahaan publik, Reddit melaporkan peningkatan pendapatan non-iklan sebesar 450% year-over-year, yang sebagian besar disebabkan oleh kesepakatan tersebut.

Saham Reddit naik 11% dalam perdagangan diperpanjang setelah pengumuman kesepakatan OpenAI.

"Paradox yang saya lihat adalah, semakin banyak konten di internet yang ditulis oleh mesin, semakin tinggi premium pada konten yang berasal dari manusia sungguhan," kata CEO Reddit Steve Huffman selama panggilan pendapatan perusahaan pada bulan Maret. "Dan kami memiliki hampir dua dekade percakapan autentik. "

Platform Reddit - yang memiliki lebih dari 1 miliar posting dan lebih dari 16 miliar komentar, angka yang meningkat setiap hari berkat ratusan juta pengguna aktifnya - adalah tambang emas bagi perusahaan AI generatif, yang modelnya belajar dari contoh konten, seperti teks dan gambar, untuk menghasilkan konten baru yang serupa.

Namun, perusahaan ini bisa menghadapi penolakan dari pengguna yang khawatir tentang bagaimana ia memonetisasi data mereka.

Hal ini bermanfaat untuk melihat Stack Overflow, forum tanya jawab untuk pengembang perangkat lunak, yang baru-baru ini menandatangani kesepakatan dengan OpenAI untuk menyediakan data untuk pelatihan model terakhir. Sebagai protes, beberapa pengguna menghapus jawaban terbaik mereka pada pertanyaan di komunitas. Tetapi Stack Overflow mengembalikan posting yang dihapus dan melarang pengguna tersebut, menyatakan bahwa mereka tidak sesuai dengan syarat layanan mereka.

Reddit sudah menyatakan ketidakpuasannya dengan upaya untuk memberikan pengguna Reddit kendali lebih atas data mereka sendiri.

Vana, sebuah startup yang dibangun di blockchain, mencoba meluncurkan "DAO" data (Digital Autonomous Organization) untuk membiarkan pengguna Reddit menyatukan data mereka dan membiarkan mereka bersama-sama memutuskan bagaimana data yang tergabung tersebut digunakan (atau dijual). Reddit melarang subreddit Vana yang didedikasikan untuk diskusi tentang DAO, dalam sebuah pernyataan kepada TechCrunch, dan menuduh perusahaan tersebut "mengambil keuntungan" dari kontrol ekspor datanya.

Kami akan meluncurkan newsletter AI! Daftar di sini untuk mulai menerimanya di kotak masuk Anda pada 5 Juni.