- Dipankar Sarkar: Seorang teknolog dan pengusaha/
- Tulisan-tulisanku/
- Mendorong Konten Terpersonalisasi: Mesin Rekomendasi Baru Momspresso/
Mendorong Konten Terpersonalisasi: Mesin Rekomendasi Baru Momspresso
Daftar isi
Dalam dunia digital yang kaya konten saat ini, menyampaikan konten yang tepat kepada pengguna yang tepat pada waktu yang tepat sangatlah penting. Melanjutkan pekerjaan kami sebelumnya pada pipeline data Momspresso, kami kini telah mengimplementasikan mesin rekomendasi yang kuat yang mempersonalisasi konten untuk jutaan pengguna Momspresso. Mari kita lihat bagaimana kami membangun sistem ini.
Tantangan #
Momspresso membutuhkan sistem rekomendasi yang dapat:
- Memproses volume besar data interaksi pengguna
- Menghasilkan rekomendasi artikel yang dipersonalisasi dengan cepat
- Memperbarui rekomendasi secara real-time saat pengguna berinteraksi dengan konten
- Dapat diskalakan untuk menangani jutaan pengguna dan artikel
Solusi Kami: Mesin Rekomendasi Berbasis Spark #
Kami merancang sistem rekomendasi multi-komponen yang memanfaatkan pipeline data yang kami bangun sebelumnya:
1. Skrip Pembuatan Data #
Menggunakan penyimpanan acara dari pipeline data kami, kami membuat skrip untuk menghasilkan set pelatihan untuk model rekomendasi kami. Ini memungkinkan kami menggunakan data interaksi pengguna nyata untuk melatih model kami.
2. Spark ML-lib untuk Pelatihan Model #
Kami menyiapkan sistem berbasis Spark ML-lib untuk pelatihan model. Saat ini kami menggunakan penyaringan kolaboratif, yang dapat dilatih dengan cepat hanya dengan data 3-4 hari. Ini memungkinkan kami untuk memperbarui model kami secara berkala, memastikan rekomendasi kami tetap relevan.
3. Layanan Web Rekomendasi #
Kami membangun layanan web yang menyajikan rekomendasi artikel berdasarkan ID pengguna. Untuk mengatasi latensi tinggi dalam memuat model ke dalam memori, kami menerapkan strategi caching menggunakan Redis. Ini memastikan waktu respons yang cepat untuk rekomendasi kami.
4. Layanan Hapus Rekomendasi #
Untuk menjaga rekomendasi tetap segar, kami menerapkan layanan yang menghapus artikel yang telah dilihat dari rekomendasi pengguna. Layanan ini terhubung ke Kafka dan mendengarkan acara tampilan, memperbarui rekomendasi secara real-time.
Fitur Utama Mesin Rekomendasi Kami #
Personalisasi: Dengan menggunakan penyaringan kolaboratif, kami dapat memberikan rekomendasi yang disesuaikan berdasarkan perilaku pengguna serupa.
Pembaruan Real-time: Sistem kami memperbarui rekomendasi saat pengguna berinteraksi dengan konten, memastikan relevansi.
Skalabilitas: Penggunaan Spark dan Redis memungkinkan sistem kami menangani volume data dan pengguna yang besar secara efisien.
Fleksibilitas: Desain modular kami memungkinkan kami untuk dengan mudah mengganti algoritma rekomendasi atau menambahkan fitur baru di masa depan.
Implementasi dan Hasil #
Mengintegrasikan mesin rekomendasi dengan platform Momspresso cukup mudah. Kami melakukan perubahan konfigurasi kecil di Nginx untuk menggunakan layanan web rekomendasi baru kami sebagai API untuk salah satu feed di situs web produksi.
Hasil awal sangat menjanjikan:
- Peningkatan Keterlibatan: Pengguna menghabiskan lebih banyak waktu di platform, membaca lebih banyak artikel per sesi.
- Penemuan yang Lebih Baik: Pengguna menemukan dan terlibat dengan berbagai konten yang lebih luas.
- Peningkatan Kepuasan Pengguna: Umpan balik awal menunjukkan pengguna menganggap rekomendasi yang dipersonalisasi berharga.
Melihat ke Depan #
Saat kami terus menyempurnakan mesin rekomendasi kami, kami bersemangat tentang beberapa peningkatan di masa depan:
- Pendekatan Multi-model: Menerapkan model rekomendasi yang berbeda untuk jenis konten atau segmen pengguna yang berbeda.
- Penyaringan Berbasis Konten: Memasukkan fitur artikel untuk meningkatkan rekomendasi, terutama untuk konten baru atau niche.
- Kerangka Pengujian A/B: Membangun sistem untuk dengan mudah menguji strategi rekomendasi yang berbeda.
Dengan terus meningkatkan mesin rekomendasi kami, kami membantu Momspresso memberikan lebih banyak nilai kepada pengguna mereka, menjaga mereka tetap terlibat dan kembali untuk konten yang lebih dipersonalisasi.
Nantikan postingan kami berikutnya, di mana kami akan membahas bagaimana kami menggunakan pipeline data dan mesin rekomendasi untuk mendapatkan wawasan yang dapat ditindaklanjuti untuk strategi konten Momspresso!