Rolly Maulana Awangga

Masih Belajar Guys..

Konten:

  1. Machine Learning CS229_ML

Trend Terkini Kecerdasan Buatan

  1. Adaptive Learning
  2. Federated Learning
  3. Self-Supervised Learning
  4. Transformer Neural Network
  5. Hybrid Symbolic AI
  6. Automated Machine Learning
  7. SAFE AI

Materi Interaktif

  1. Mamba (State Space Model) — arsitektur pengganti Transformer
  2. SSM — State Space Model
  3. SAFE AI — Secure — keamanan AI: threat model, serangan & pertahanan (demo interaktif)

Adaptive Learning

Sering juga disebut sebagai active learning atau human in the loop machine learning

Federated Learning

Berhubungan dengan keamanan data, pemberlakukan pembobotan model yang valid dengan sistem insentif

Self-Supervised Learning

Utamanya di augmentation/masking policy

Tepat, tapi khusus untuk metode tertentu (terutama di gambar/visi). Dalam metode SSL seperti Contrastive Learning (misal: SimCLR), augmentasi (seperti cropping, rotasi, ubah warna) adalah jantung utamanya. Tapi di data teks (NLP), SSL biasanya tidak pakai augmentasi seperti itu, melainkan teknik menyembunyikan kata (masking).

ada ukuran2 statistik

Model belajar menggunakan fungsi matematis dan statistik (seperti Contrastive Loss atau InfoNCE loss) untuk mengukur jarak seberapa “mirip” atau “jauh” representasi data yang dia pelajari.

Training tanpa data, fine-tune menggunakan sedikit label.

Jika training dengan sedikit data itu namanya Semi-Supervised Learning. Dalam fase belajar utama SSL (pre-training), TIDAK ADA manual label dari manusia sama sekali (0%).

Yang sering terjadi adalah: Setelah model SSL selesai belajar tanpa label dan menjadi “pintar” mengenali pola, model tersebut kemudian di-fine-tune untuk tugas spesifik menggunakan data yang sedikit ada labelnya. Jadi, proses sedikit label itu terjadi setelah SSL selesai, bukan bagian dari SSL itu sendiri.

SSL intinya belajar memsupervisi sendiri

Model menyembunyikan atau memanipulasi sebagian dari data tersebut, lalu mencoba memprediksi bagian yang disembunyikan menggunakan bagian yang tersisa. Secara garis besar, ada dua cara paling populer bagaimana SSL melakukan ini:

Cara A: Memprediksi Bagian yang Hilang (Generative / Masking)

Ini paling sering dipakai di teks (seperti ChatGPT atau BERT) dan belakangan mulai populer di gambar (Masked Autoencoders).

Cara B: Mencocokkan Kesamaan (Contrastive Learning)

Ini cara yang memakai “augmentation policy” yang kamu sebutkan tadi, sangat populer untuk data berupa gambar atau suara.

Cara C: Saling Berkompetisi / Bertarung (Adversarial Learning)

Ini adalah metode yang sangat populer untuk menciptakan data sintesis yang luar biasa realistis (seperti gambar AI, suara tiruan, atau video Deepfake), utamanya menggunakan arsitektur GANs (Generative Adversarial Networks).

Kesimpulan: Dengan memecahkan “teka-teki” (menebak kata yang hilang atau mencocokkan gambar yang diaugmentasi) pada jutaan data yang tidak berlabel, model akhirnya mengerti tata bahasa, konteks, garis, warna, dan struktur visual secara mendalam.