Studi: Kekasaran pada ChatGPT Tingkatkan Akurasi Jawaban

Studi: Kekasaran pada ChatGPT Tingkatkan Akurasi Jawaban

Penemuan Menarik dalam Studi Baru tentang Interaksi Manusia-AI

Sebuah studi terbaru menunjukkan bahwa bersikap kasar terhadap chatbot AI seperti ChatGPT justru dapat meningkatkan akurasi jawaban. Temuan ini bertentangan dengan penelitian sebelumnya yang menyatakan bahwa kesopanan bisa membuat respons AI menjadi lebih baik. Studi ini, yang dipublikasikan di basis data pra-cetak arXiv pada 6 Oktober, masih belum melalui proses peer review.

Para peneliti menguji pengaruh nada sopan atau kasar terhadap performa sistem AI. Mereka membuat 50 pertanyaan pilihan ganda dasar dan memodifikasinya menjadi lima kategori nada: sangat sopan, sopan, netral, kasar, dan sangat kasar. Pertanyaan tersebut mencakup berbagai bidang seperti matematika, sejarah, dan sains. Setiap versi pertanyaan kemudian diuji sepuluh kali menggunakan ChatGPT-4o, salah satu model bahasa besar (LLM) terbaru dari OpenAI.

Menurut kesimpulan studi tersebut, nada dapat memengaruhi kinerja AI secara signifikan. Para peneliti menemukan bahwa nuansa kasar memberi hasil yang lebih baik dibandingkan nuansa sopan. Hasil ini menunjukkan bahwa penggunaan bahasa yang menghina atau merendahkan dalam interaksi manusia-AI dapat berdampak negatif pada pengalaman pengguna, aksesibilitas, dan inklusivitas. Gaya komunikasi ini juga dikhawatirkan berkontribusi pada norma komunikasi yang berbahaya.

Dalam percobaan tersebut, chatbot diminta untuk mengabaikan percakapan sebelumnya agar tidak terpengaruh oleh nada lain. Hasilnya, tingkat akurasi meningkat dari 80,8 persen pada nada sangat sopan menjadi 84,8 persen pada nada sangat kasar. Secara berurutan, tingkat akurasi nada sopan adalah 81,4 persen, netral 82,2 persen, dan kasar 82,8 persen.

Untuk menghasilkan variasi nada, para peneliti menambahkan awalan tertentu pada setiap pertanyaan. Misalnya, nada sangat sopan diawali dengan kalimat seperti “Bolehkah saya meminta bantuan Anda dengan pertanyaan ini?” sedangkan nuansa sangat kasar menggunakan frasa seperti “Hei, kuli serba guna, selesaikan ini,” atau “Saya tahu Anda tidak pintar, tapi coba ini.”

Studi ini menjadi bagian dari bidang prompt engineering, yang mempelajari bagaimana struktur dan gaya bahasa pada perintah pengguna mempengaruhi hasil AI. Penelitian ini juga menyebutkan riset sebelumnya yang menemukan bahwa prompt tidak sopan cenderung menurunkan performa akal imitasi. Namun, bahasa yang terlalu sopan juga tidak selalu menjamin hasil yang lebih baik.

Para peneliti mengakui bahwa penelitian ini memiliki keterbatasan karena hanya menggunakan 250 pertanyaan dan satu model AI, sehingga hasilnya belum bisa digeneralisasi. Mereka berencana memperluas eksperimen dengan model lain, seperti Claude dari Anthropic dan ChatGPT o3 dari OpenAI, untuk melihat apakah hasil serupa akan muncul.

Implikasi dan Tantangan dalam Penggunaan AI

Temuan ini membuka wawasan baru tentang bagaimana cara berkomunikasi dengan AI dapat memengaruhi hasil yang diberikan. Meskipun hasil menunjukkan bahwa nada kasar meningkatkan akurasi, hal ini tidak berarti bahwa penggunaan bahasa kasar harus diadopsi dalam interaksi sehari-hari. Justru sebaliknya, penting untuk menjaga komunikasi yang sopan dan saling menghargai.

Selain itu, studi ini juga menyoroti pentingnya diversifikasi dalam pengujian model AI. Dengan menggunakan berbagai model dan skenario, peneliti dapat memahami lebih dalam bagaimana AI merespons berbagai jenis input. Hal ini akan membantu dalam pengembangan sistem AI yang lebih efektif dan ramah pengguna.

Penggunaan prompt engineering sebagai alat untuk memengaruhi hasil AI juga menjadi area penting yang perlu dikaji lebih lanjut. Dengan memahami bagaimana struktur dan gaya bahasa memengaruhi respons AI, pengguna dapat lebih efisien dalam mengambil manfaat dari teknologi ini.

Secara keseluruhan, studi ini memberikan kontribusi penting dalam memahami dinamika antara manusia dan AI. Meski ada batasan, temuan ini menjadi langkah awal dalam mengeksplorasi potensi AI secara lebih mendalam.

Related posts