Akankah Tembakan Steph Curry Selanjutnya Menjadi Desir? Siswa Ilmu Data Ini Mungkin Tahu

Superstar NBA Steph Curry adalah salah satu penembak terbaik yang pernah ada di dunia. Tapi sehebat dia, dia masih meleset sekitar 53% dari usahanya. (Rata-rata penembak di NBA meleset sekitar 55% tembakannya.)

Dengan begitu banyak keberhasilan pemain berdasarkan pengambilan bidikan yang optimal – seperti yang berasal dari lokasi terbaik di lapangan, serta faktor lainnya – empat mahasiswa UVA dari School of Data Science University of Virginia mulai membuat model yang dapat memprediksi apakah upaya field goal akan berhasil atau gagal.

Menggunakan kumpulan data dari musim 2016-17, yang melacak lebih dari 210.000 tembakan, tim Kristy Bell, Abhi Dommalapati, Jack Peele, dan Spencer Bozsik menciptakan model yang memenangkan Hackathon pertama di School of Data Science Sports Analytics Club semester lalu .

“Saya bangga dengan tim saya dan bagaimana kami bekerja bersama untuk menggunakan jalur ilmu data secara efektif untuk menjawab pertanyaan yang kami minati,” kata Bell. “Lebih dari segalanya, memenangkan kompetisi memberi kelompok kami kepercayaan diri bahwa kami dapat menerapkan apa yang kami pelajari dalam program kami ke kumpulan data olahraga yang sebenarnya.”

UVA Today bertemu dengan Bell, penduduk asli Pennsylvania yang lulus musim semi lalu dari UVA dengan gelar sarjana di bidang statistik dan ekonomi – dan yang sekarang mengejar gelar masternya di sini dalam ilmu data – untuk mempelajari lebih lanjut tentang model dan metodologi tim.

T. Bisakah Anda memberi tahu pembaca UVA Today sedikit lebih banyak tentang tujuan tim?

PADA. Kami diberikan kumpulan data yang mencantumkan beberapa atribut untuk setiap tembakan di musim NBA 2016-17, termasuk pemain, tim tuan rumah, tim tandang, jenis tembakan, lokasi tembakan, waktu tersisa dalam permainan, dan hasil tembakan terakhir pemain. Data memerlukan sedikit perdebatan data sebelum membuat model (misalnya mengubah lokasi bidikan menjadi jarak dari net, menyederhanakan jenis bidikan).

Dengan menggunakan subset dari fitur yang disediakan, kami berusaha membuat model untuk memprediksi apakah sebuah tembakan berhasil atau gagal. … Tujuan utama kami adalah memiliki model yang mampu memprediksi secara akurat apakah bidikan dilakukan atau tidak, pada kumpulan data baru yang berisi variabel yang sama.

T. Bagaimana Anda, Abhi, Jack dan Spencer mengerjakan ini sebagai sebuah tim? Apakah Anda membagi tugas tertentu?

A. Sebagian besar, kami memutuskan untuk membuat kode bersama. Siapa pun yang tidak membagikan layarnya, sedang menggunakan komputernya untuk mendapatkan lebih banyak ide dan/atau menguraikan catatan kelas untuk membantu rekan satu timnya secara aktif membuat kode. Meskipun kami menemukan pengkodean grup menjadi efisien, waktu pertemuan yang dialokasikan untuk hackathon tidak cukup untuk pembersihan data dan pembuatan model yang memadai. Akibatnya, kami mengumpulkan satu kali di luar waktu yang ditentukan untuk menguji model kami dan menyesuaikan parameter kami.

Q. Apakah ada hal-hal yang mengejutkan Anda selama proyek berlangsung?

J. Kami terkejut menemukan bahwa data log tembakan NBA tidak sebersih dan seintuitif yang awalnya kami yakini. Lebih banyak waktu selama hackathon dihabiskan untuk memahami dari mana data berasal dan membuat variabel baru dari yang lama daripada yang kami perkirakan.

Misalnya, kami harus mengandalkan metadata untuk memahami di mana koordinat lokasi “x” dan “y” di lapangan mengacu – dan menggunakannya untuk membuat jarak ke variabel keranjang. Dalam banyak hal, membersihkan data seperti berburu harta karun; memiliki empat pasang mata untuk menangkap kesalahan sangat bermanfaat! Menemukan kekurangan dan memperdebatkan data mentah adalah masalah ilmu data yang sangat umum yang menekankan mengapa hackathon adalah pengalaman pendidikan yang hebat.

T. Apa kesimpulan tim?

A. Hal utama yang dapat diambil dari proyek ini adalah bahwa hasil pemotretan pemodelan tidak semudah yang kami harapkan – setidaknya dengan kumpulan data yang terbatas ini. Ada banyak variabel yang tidak dimasukkan ke dalam model kami yang kemungkinan besar memiliki dampak signifikan dalam membuat atau melewatkan tembakan. Akibatnya, kami tidak dapat mencapai akurasi tinggi yang kami harapkan dan harapkan – tidak ada grup yang dapat melakukannya. Mungkin menggunakan teknik pembelajaran mendalam yang memanfaatkan data pelacakan pemain dapat menghasilkan kinerja yang unggul.

Q. Apa jadinya model ini sekarang? Maukah Anda mencoba dan memperbaikinya atau mungkin melihat apakah ada tim profesional yang ingin melakukan sesuatu dengannya?

A. Sepanjang waktu kami dalam program – dan sejak hackathon – kami selalu diperkenalkan dengan model pembelajaran mesin dan alat ilmu data baru yang lebih kompleks. Akibatnya, saya menemukan diri saya melakukan brainstorming bagaimana model atau strategi alternatif dapat digunakan untuk meningkatkan kinerja model prediksi bidikan kami.

Faktanya, kami memiliki beberapa anggota klub yang menggunakan kumpulan data hackathon untuk proyek akhir mereka dalam kursus pembelajaran mesin Bayesian. Dengan itu, mereka menemukan bahwa model hierarkis yang lebih kompleks yang memperhitungkan perbedaan antara pemain menghasilkan akurasi yang lebih tinggi dalam prediksi tembakan, yang menarik untuk dilihat!

T. Apakah ada hal lain yang ingin Anda tambahkan?

A. Mendapatkan pengalaman bekerja dengan data olahraga yang berantakan dan menghasilkan model yang Anda banggakan untuk dibicarakan selama wawancara sangat berharga ketika mencoba masuk ke industri analisis olahraga. Karena pekerjaan yang dilakukan selama pertemuan Sports Analytics Club, saya menjadi lebih percaya diri dan berpengalaman dalam wawancara ini.

Selain itu, hackathon meningkatkan minat saya dalam menggunakan data granular untuk membangun model yang dapat secara efektif memprediksi hasil olahraga. Saya bersemangat untuk mengejar minat ini setelah lulus bekerja sebagai ilmuwan data di FanDuel Sportsbook. Saya tahu bahwa banyak anggota [Master of Science in Data Science] Klub Analisis Olahraga – termasuk saya sendiri – sangat menikmati hackathon NBA dan berharap dapat menampilkan keterampilan kami yang berkembang ke kumpulan data terkait olahraga yang berbeda selama hackathon berikutnya di akhir semester musim semi ini.

Leave a Comment