Lima Metode Pembelajaran Mesin Yang Harus Diketahui Pedagang Crypto
General

Lima Metode Pembelajaran Mesin Yang Harus Diketahui Pedagang Crypto

Baru-baru ini artikel, Saya membahas relevansi teknik pembelajaran mesin yang mendukung GPT-Three OpenAI yang terkenal untuk pasar kripto. GPT-3 – yang dapat menjawab pertanyaan, melakukan analisis bahasa, dan menghasilkan teks – mungkin merupakan pencapaian paling terkenal dalam beberapa tahun terakhir dari ruang pembelajaran mendalam. Tapi, tidak berarti, apakah itu yang paling berlaku untuk ruang crypto. Pada artikel ini, saya ingin membahas beberapa space baru dari pembelajaran mendalam yang dapat memiliki dampak langsung yang dekat dalam mannequin kuantitatif yang diterapkan pada kripto.

Jesus Rodriguez adalah CEO IntoTheBlock, platform intelijen pasar untuk aset kripto. Dia telah memegang peran kepemimpinan di perusahaan teknologi besar dan hedge fund. Dia adalah investor aktif, pembicara, penulis, dan dosen tamu di Universitas Columbia di New York.

Mannequin seperti GPT-Three atau BERT Google adalah hasil dari terobosan besar dalam pembelajaran mendalam yang dikenal sebagai mannequin pra-pelatihan dan transformator bahasa. Teknik ini, bisa dibilang, mewakili tonggak terbesar dalam beberapa tahun terakhir industri pembelajaran mendalam dan dampaknya tidak luput dari perhatian di pasar modal.

Pada tahun lalu, ada upaya penelitian aktif di bidang keuangan kuantitatif yang mengeksplorasi bagaimana mannequin transformator dapat diterapkan pada kelas aset yang berbeda. Namun, hasil dari upaya ini masih samar yang menunjukkan bahwa transformator masih jauh dari siap untuk beroperasi dalam kumpulan knowledge keuangan dan sebagian besar tetap berlaku untuk knowledge tekstual. Tapi tidak ada alasan untuk merasa buruk. Sementara mengadaptasi transformator ke skenario keuangan tetap relatif menantang, space baru lain dari ruang pembelajaran mendalam menunjukkan janji ketika diterapkan dalam mannequin kuant pada berbagai kelas aset termasuk crypto.

Dari banyak sudut, crypto tampaknya seperti kelas aset yang sempurna untuk mannequin kuantitatif berbasis pembelajaran mendalam. Itu karena DNA digital dan transparansi aset kripto dan bahwa kebangkitan kripto bertepatan dengan kebangkitan pembelajaran mesin dan munculnya pembelajaran mendalam.

Setelah perjuangan selama puluhan tahun dan beberapa musim dingin yang disebut "kecerdasan buatan (AI)", pembelajaran mendalam akhirnya menjadi nyata dan agak umum di berbagai bidang industri perangkat lunak. Keuangan kuantitatif telah menjadi salah satu pengadopsi tercepat dari penelitian dan teknologi pembelajaran mendalam yang baru. Sangat umum bagi beberapa dana kuantitatif teratas di pasar untuk bereksperimen dengan jenis ide yang sama yang keluar dari laboratorium penelitian AI berteknologi tinggi seperti Fb, Google atau Microsoft.

Lihat juga: Jesus Rodriguez – 10 Alasan Strategi Kuantitas untuk Crypto Gagal

Beberapa perkembangan paling menarik dalam pembiayaan quant fashionable tidak datang dari teknik mencolok seperti transformator, tetapi dari terobosan pembelajaran mesin yang menarik yang lebih dikembangkan untuk skenario kuant. Banyak dari metode tersebut dapat diterapkan dengan sempurna untuk teknik kuantiti aset kripto dan mulai membuat terobosan dalam mannequin kripto kuantitatif.

Di bawah ini, saya telah membuat daftar lima space pembelajaran mendalam yang muncul yang sangat penting untuk skenario kripto kuantitatif. Saya mencoba menjaga penjelasannya relatif sederhana dan disesuaikan dengan skenario crypto.

1) Buat grafik jaringan saraf

Set knowledge Blockchain adalah sumber alfa unik untuk mannequin kuantitatif di ruang crypto. Dari perspektif struktural, knowledge blockchain secara intrinsik bersifat hierarkis dan diwakili oleh grafik dengan node mewakili alamat yang dihubungkan oleh tepi yang mewakili transaksi. Bayangkan sebuah skenario di mana mannequin kuant mencoba memprediksi volatilitas bitcoin dalam pertukaran tertentu berdasarkan karakteristik alamat yang mentransfer dana ke bursa. Mannequin semacam itu perlu beroperasi secara efisien di atas knowledge hierarki. Namun sebagian besar teknik pembelajaran mesin dirancang untuk bekerja dengan kumpulan knowledge tabel, bukan grafik.

Graph neural community (GNNs) adalah disiplin pembelajaran mendalam baru yang berfokus pada mannequin yang beroperasi secara efisien pada struktur knowledge grafik. GNN adalah space pembelajaran mendalam yang relatif baru yang baru ditemukan pada tahun 2005. Namun, GNN telah banyak diadopsi dari perusahaan seperti Uber, Google, Microsoft, DeepMind dan lain-lain.

Dalam contoh skenario kami, GNN dapat menggunakan grafik sebagai enter yang mewakili arus masuk dan keluar bursa dan menyimpulkan pengetahuan relevan yang relevan dengan dampaknya pada harga. Dalam konteks aset kripto, GNN berpotensi mengaktifkan metode kuant baru berdasarkan kumpulan knowledge blockchain.

2) Mannequin generatif

Salah satu keterbatasan mannequin kuantitatif pembelajaran mesin adalah kurangnya kumpulan knowledge historis yang besar. Misalkan Anda mencoba membuat mannequin prediksi untuk harga rantai (LINK) berdasarkan perilaku perdagangan historisnya. Meskipun konsepnya tampak menarik, ini mungkin terbukti menantang karena LINK memiliki knowledge perdagangan historis lebih dari setahun di bursa seperti Coinbase. Set knowledge kecil itu tidak akan cukup untuk sebagian besar jaringan neural dalam untuk menggeneralisasi pengetahuan yang relevan.

Mannequin generatif adalah jenis metode pembelajaran mendalam yang berspesialisasi dalam menghasilkan knowledge sintetis yang cocok dengan distribusi set knowledge pelatihan. Dalam skenario kami, bayangkan bahwa kami melatih mannequin generatif dalam distribusi orderbook tautan di Coinbase untuk menghasilkan pesanan baru yang cocok dengan distribusi buku pesanan yang sebenarnya.

Menggabungkan dataset nyata dan sintetis, kita dapat membangun dataset yang cukup besar untuk melatih mannequin deep studying yang canggih. Konsep mannequin generatif tidak terlalu baru tetapi telah mendapatkan banyak daya tarik dalam beberapa tahun terakhir dengan munculnya teknik populer seperti jaringan saraf tiruan adversarial generatif (GAN), yang telah menjadi salah satu metode paling populer di berbagai bidang seperti klasifikasi gambar. dan telah digunakan dengan kesuksesan yang relevan dengan kumpulan knowledge keuangan deret waktu.

3) Pembelajaran semi-supervisi

Set knowledge berlabel langka di ruang kripto dan itu sangat membatasi jenis mannequin kuantitatif pembelajaran mesin (ML) yang dapat dibangun dalam skenario dunia nyata. Bayangkan kita mencoba membangun mannequin ML yang membuat prediksi harga berdasarkan aktivitas meja over-the-counter (OTC). Untuk melatih mannequin tersebut, kami memerlukan kumpulan knowledge berlabel besar dengan alamat milik meja OTC yang merupakan jenis kumpulan knowledge yang hanya dimiliki oleh beberapa entitas di pasar kripto.

Pembelajaran semi-supervised adalah teknik pembelajaran mendalam yang berfokus pada pembuatan mannequin yang dapat dipelajari dengan set knowledge berlabel kecil dan knowledge tak berlabel dalam jumlah besar. Pembelajaran semi-supervisi dianalogikan dengan seorang guru yang mempresentasikan beberapa konsep kepada sekelompok siswa dan menyerahkan konsep-konsep lain pada pekerjaan rumah dan belajar mandiri.

Dalam contoh skenario kami, bayangkan bahwa kami melatih mannequin dengan sekumpulan kecil perdagangan berlabel dari meja OTC dan sekumpulan besar perdagangan tak berlabel. Mannequin pembelajaran semi-supervisi kami akan mempelajari fitur-fitur utama dari kumpulan knowledge berlabel seperti ukuran atau frekuensi perdagangan dan akan menggunakan kumpulan knowledge tak berlabel untuk memperluas pelatihan.

4) Pembelajaran representasi

Ekstraksi dan pemilihan fitur adalah komponen kunci dari mannequin pembelajaran mesin kuant dan sangat relevan dalam masalah yang tidak dipahami dengan baik seperti prediksi aset kripto. Bayangkan kita sedang mencoba membuat mannequin prediksi untuk harga bitcoin berdasarkan catatan buku pesanan.

Salah satu aspek terpenting dari upaya kami adalah menentukan atribut atau fitur mana yang dapat bertindak sebagai prediktor. Apakah ini harga menengah, quantity, atau seratus faktor lainnya? Pendekatan tradisional mengandalkan ahli materi pelajaran untuk membuat fitur-fitur ini, tetapi itu bisa menjadi sulit untuk diukur dan dipelihara seiring waktu.

Pembelajaran representasi adalah bidang pembelajaran dep yang berfokus pada otomatisasi pembelajaran representasi atau fitur yang strong untuk membangun mannequin yang lebih efektif. Alih-alih mengandalkan pemodelan fitur manusia, pembelajaran representasi mencoba mengekstrapolasi fitur langsung dari kumpulan knowledge yang tidak berlabel. Dalam contoh kami, metode pembelajaran representasi dapat menganalisis buku pesanan dan mengidentifikasi ratusan ribu fitur potensial yang dapat bertindak sebagai prediktor untuk harga Bitcoin. Tingkat penskalaan dan otomatisasi tidak mungkin dicapai dalam rekayasa fitur guide.

5) Pencarian arsitektur saraf

Proses pembuatan mannequin pembelajaran mesin quant tetap sangat subyektif dalam banyak aspek. Mari kita ambil skenario mannequin yang mencoba memperkirakan harga Ethereum berdasarkan aktivitas dalam sekumpulan protokol DeFi. Mengingat sifat masalahnya, knowledge scientist akan memiliki preferensi tertentu tentang jenis mannequin dan arsitektur yang akan digunakan.

Dalam skenario kami, sebagian besar ide tersebut akan didasarkan pada pengetahuan area dan opini subjektif tentang cara aktivitas dalam protokol DeFi dapat memengaruhi harga Ethereum. Mengingat bahwa pembelajaran mesin didasarkan pada membangun pengetahuan dan pengetahuan bukanlah unit diskrit, hampir tidak mungkin untuk memperdebatkan manfaat satu metode versus metode lain untuk masalah tertentu.

Pencarian arsitektur saraf (NAS) adalah salah satu space pembelajaran mendalam yang mencoba mengotomatiskan mannequin pembuatan menggunakan pembelajaran mesin. Semacam menggunakan pembelajaran mesin untuk membuat pembelajaran mesin. Mengingat masalah goal dan kumpulan knowledge, metode NAS akan mengevaluasi ratusan kemungkinan arsitektur jaringan neural dan mengeluarkan arsitektur dengan hasil yang paling menjanjikan.

Dalam skenario sampel kami, metode NAS dapat memproses kumpulan knowledge yang menggabungkan perdagangan di bursa terdesentralisasi dan menghasilkan beberapa mannequin yang berpotensi dapat memprediksi harga Ethereum berdasarkan catatan tersebut.

Akan datang lebih banyak lagi

Metode yang dijelaskan di atas mewakili beberapa space pembelajaran mendalam yang muncul dan lebih berkembang yang kemungkinan besar berdampak pada mannequin kripto kuantitatif dalam jangka pendek. Dan itu bukanlah satu-satunya space pembelajaran mendalam yang harus diperhatikan crypto quant.

Disiplin pembelajaran mendalam lainnya seperti pembelajaran penguatan, pembelajaran mandiri, dan bahkan transformer dengan cepat membuat terobosan di ruang kuant. Penelitian dan eksperimen tentang teknik pembelajaran mendalam yang diterapkan pada mannequin kuantitatif terjadi di mana-mana dan crypto menjadi penerima manfaat besar dari gelombang inovasi itu.