Bukan Manusia, Kecerdasan Buatan Berhasil Dapat Skor Sempurna di Pac-Man

Ellavie Ichlasa Amalia    •    Jumat, 16 Jun 2017 14:39 WIB
teknologimicrosoft
Bukan Manusia, Kecerdasan Buatan Berhasil Dapat Skor Sempurna di Pac-Man
AI buatan Maluuba akhirnya berhasil mendapatkan nilai sempurna di Ms. Pac-Man.

Metrotvnews.com: Akhirnya, skor sempurna untuk game arcade klasik, Ms. Pac-Man berhasil didapatkan. Sayangnya, bukan manusia yang berhasil mendapatkan skor ini.

Maluuba -- tim deep learning yang Microsoft akuisisi pada Januari -- berhasil membuat sistem kecerdasan buatan yang mempelajari cara untuk mencapai nilai poin maksimal, 999.900 dalam game Ms. Pac-Man pada Atari 2600. AI ini menggunakan metode divide-and-conquer, pecah belah dan kuasai.

Seperti yang disebutkan oleh The Verge, peneliti memiliki kebiasaan utnuk menggunakan video game sebagai alat untuk menguji AI. Alasannya, karena game bisa meniru kekacauan dunia nyata dalam keadaan yang lebih terkendali daripada game yang lebih statis seperti catur.

Pada 2015, DeepMind AI dari Google berhasil menguasai hampir 49 game Atari menggunakan reinforcement learning, yang akan memberikan masukan negatif atau positif setiap kali AI mencoba untuk menyelesaikan sebuah masalah. 

Meskipun AI berhasil menguasai berbagai game retro, selama bertahun-tahun, Ms. Pac-Man tetap menjadi game yang sulit untuk dikalahkan oleh AI karena game itu memang sulit untuk ditebak. Game itu tidak hanya sulit bagi komputer, tapi juga bagi manusia. Banyak orang yang telah mencoba untuk mendapatkan nilai tertinggi dalam Ms. Pac-Man, tapi hanya mencapai 266,330 pada versi Atari 2600.



Maluuba berhasil menggunakan AI untuk menyelesaikan game ini dengan memecah tugas dalam game menjadi tugas-tugas kecil dan menugaskannya ke lebih dari 150 agen. Tim Maluuba kemudian mengajarkan AI untuk menggunakan apa yang mereka sebut sebagai Hybrid Reward Architecture, yang merupakan gabungan dari reinforcement learning dan metode divide-and-conquer.

Maluuba kemudian akan menentukan agen tertinggi. Menurut Microsoft, posisi agen top ini sama seperti manager senior dalam sebuah perusahaan. Agen tertinggi ini akan menerima saran dari agen-agen lain sebelum menentukan kemana Ms. Pac-Man harus bergerak.

Hasil terbaik berhasil dicapai ketika masing-masing agen mengambil keputusan yang sangat egois, sementara agen top fokus untuk mengambil keputusan terbaik untuk tim secara keseluruhan. Ia tidak hanya mempertimbangkan berapa banyak agen yang ingin bergerak ke suatu arah, tapi juga seberapa penting keputusan tersebut.

Misalnya, menghindari hantu lebih penting dari memakan pellet, meski agen yang ingin menghindari hantu lebih sedikit dari yang ingin memakan pellet. Maluuba berkata, Hybrid Reward Architecture sebagai pembelajaran AI dapat digunakan untuk berbagai hal, seperti memprediksi penjualan terbaik perusahaan atau mengembangkan pemrosesan bahasa natural.


(MMI)

Lenovo K6 Power, Saat Baterai adalah Segalanya
Review Smartphone

Lenovo K6 Power, Saat Baterai adalah Segalanya

5 days Ago

Melihat sepak terjang Lenovo selama ini, mereka tampaknya sadar betul bahwa konsumen Indonesia …

BERITA LAINNYA
Video /