Alat Baru Bisa Deteksi Video yang Dihasilkan AI dengan Akurasi 93,7 Persen
Peneliti di Columbia Engineering mengembangkan alat baru DIVID (DIffusion-generated VIdeo Detector) untuk mendeteksi apakah video buatan AI atau video asli.
Awal tahun ini, seorang karyawan di sebuah perusahaan multinasional secara keliru mengirim $25 juta atau setara lebih dari Rp 400 miliar kepada penipu.
Instruksi tersebut tampaknya berasal dari CFO perusahaan dalam sebuah video, tetapi sebenarnya video tersebut dibuat oleh AI.
Insiden ini menyoroti betapa realistisnya video yang dihasilkan AI, sehingga menyulitkan orang dan sistem yang ada untuk membedakan antara video asli dan palsu.
Untuk mengatasi masalah yang berkembang ini, para peneliti di Columbia Engineering, yang dipimpin oleh Profesor Ilmu Komputer Junfeng Yang, telah mengembangkan alat baru yang disebut DIVID (DIffusion-generated VIdeo Detector).
DIVID dirancang untuk mendeteksi video yang dihasilkan AI dengan akurasi 93,7% yang mengesankan.
Alat ini dibangun berdasarkan pekerjaan tim sebelumnya pada Raidar, yang mendeteksi teks yang dihasilkan AI.
DIVID menyempurnakan metode yang mendeteksi video yang dihasilkan oleh model AI lama seperti jaringan adversarial generatif (GAN).
GAN terdiri dari dua jaringan saraf: satu membuat data palsu, dan yang lain mengevaluasinya untuk membedakan antara yang palsu dan yang asli.
Namun, alat AI baru seperti Sora oleh OpenAI, Runway Gen-2, dan Pika menggunakan teknik berbeda yang disebut model difusi untuk membuat video.
Model-model ini secara bertahap mengubah noise acak menjadi gambar dan video yang jelas dan realistis dengan menyempurnakan setiap bingkai secara individual, memastikan transisi yang mulus dan hasil berkualitas tinggi.
Tim Yang menggunakan teknik yang disebut DIRE (DIffusion Reconstruction Error) untuk mendeteksi video yang dihasilkan oleh difusi ini.
DIRE mengukur perbedaan antara gambar masukan dan gambar keluaran yang direkonstruksi menggunakan model difusi yang telah dilatih sebelumnya.
Metode ini memungkinkan DIVID untuk mengidentifikasi tanda-tanda halus dari video yang dihasilkan AI yang mungkin terlewatkan oleh alat deteksi lainnya.
Awal tahun ini, tim Yang merilis Raidar, alat untuk mendeteksi teks yang dihasilkan AI.
Raidar menganalisis teks itu sendiri, mengukur berapa banyak suntingan yang dilakukan model bahasa pada teks tertentu.
Lebih banyak suntingan menunjukkan bahwa teks tersebut ditulis oleh manusia, sementara lebih sedikit suntingan menunjukkan bahwa teks tersebut kemungkinan besar dibuat oleh AI.
Konsep ini terbukti ampuh untuk deteksi teks dan menginspirasi tim untuk menerapkannya pada deteksi video.
“Wawasan dalam Raidar—bahwa keluaran AI sering dianggap berkualitas tinggi oleh AI lain, sehingga menghasilkan lebih sedikit suntingan—benar-benar hebat dan melampaui sekadar teks,” kata Yang.
“Mengingat bahwa video yang dihasilkan AI menjadi semakin realistis, kami ingin mengambil wawasan Raidar dan membuat alat yang dapat mendeteksi video yang dihasilkan AI secara akurat.”
Para peneliti menggunakan konsep yang sama untuk mengembangkan DIVID, menciptakan metode deteksi video generatif yang dapat mengidentifikasi video yang diproduksi oleh model difusi.
Makalah penelitian mereka, yang mencakup kode dan kumpulan data sumber terbuka, dipresentasikan di Computer Vision and Pattern Recognition Conference (CVPR) di Seattle pada tanggal 18 Juni 2024.
Dengan akurasi DIVID yang tinggi, ia menawarkan solusi yang menjanjikan untuk tantangan membedakan video nyata dari yang dihasilkan AI.
Alat ini dapat menjadi krusial dalam mencegah penipuan dan memastikan keaslian konten video di berbagai bidang, mulai dari keamanan perusahaan hingga media sosial.