The Tech Behind LLMs

Do you often use AI but never really know what it does with your prompt? 🤔 Let’s dive a bit into the tech behind it — the Transformer inside LLMs (Large Language Models).

The video below breaks it down step by step, showing what’s really going on during an AI’s “thinking” process 🧠. This is the core engine behind tools like ChatGPT, Gemini, and other Generative AI.

But here’s the big question: do they actually think... or are they just predicting words? 🤖
Watch the video below to find out! 🎥

Ringkasan

Ilustrasi Cara Eksekusi Prompt oleh si-Transformer

Potong dulu → “token”
Kalimat yang sudah kita prompt dipecah jadi potongan kecil (token).
Ubah token jadi angka → “embedding” (mempetakan makna)
Setiap token dipetakan ke sebuah vektor (daftar angka). Kata yang mirip makna letaknya berdekatan di “ruang” berdimensi sangat tinggi. (Contoh: GPT-3 memakai 12.288 dimensi untuk embedding.)
Attention = lampu sorot konteks
Contohnya misal kata-kata “ngobrol” saling memberi informasi, “mole” di kalimat biologi ≠ “mole” di kimia/penyakit kulit, attention menyesuaikan makna sesuai tetangga katanya. Intinya: model menyorot bagian konteks yang relevan sebelum memperbarui makna kata itu.
Feed-forward = cek cepat paralel
Setelah disorot, tiap vektor melewati “pemeriksaan” paralel (multi-layer perceptron) untuk memperkaya detail. Lapisan attention dan feed-forward ditumpuk berkali-kali, di sinilah “deep” pada deep learning.
Pilih kata berikutnya → softmax & “temperature”
Di akhir, model menghasilkan distribusi peluang semua token kandidat. Softmax membuatnya jadi probabilitas, “temperature” bisa membuat keluaran lebih aman (dingin) atau kreatif (hangat).
Skala itu kunci
Model modern besar sekali: 175 miliar parameter (contoh GPT-3). Banyak parameter justru ada di blok-blok di antara attention. Kekuatan transformer datang dari paralelisme sehingga bisa dilatih pada GPU dalam skala super besar. Arsitektur ini lahir dari paper 2017 “Attention Is All You Need”.

Ilustrasi

Rapat Meja Bundar: setiap kata mengajukan pertanyaan (query) “siapa yang relevan buatku?” dan yang relevan mengangkat tangan (key) lalu berbagi isi (value). Hasilnya: makna kata makin spesifik sesuai konteks.
Kamus 3D Raksasa: kata = titik di ruang besar. “Ratu” dekat dengan “raja”, tapi bergeser arah “perempuan vs laki‑laki”. (Ilustrasi; kenyataan lebih kompleks.)
Termometer Kreativitas: temperature tinggi = ide unik; rendah = jawaban rapi/aman.

Kekuatan vs Keterbatasan

Kuat: ringkas teks, menjelaskan konsep, brainstorming ide, menulis draf, menerjemah ringan.
Terbatas: bisa sangat meyakinkan saat salah (halusinasi), bias dari data latih, tidak “mengerti” dunia seperti manusia, sensitif pada cara kita memberi instruksi (prompt).

Do & Don’t

Tulis tujuan & peran dengan jelas (format, gaya, batasan).
Verifikasi angka/fakta penting sebelum dipakai.
Simpan jejak prompt & hasil penting.
Mulai dari use‑case kecil: ringkas email, outline presentasi, ide awal.

Don’t

Menempelkan data rahasia/sensitif.
Menganggap hasil AI selalu benar.
Bergantung total tanpa nalar & pengecekan.

Lesson learned

1) Jangan mendewakan - anggap AI sebagai “kalkulator bahasa”
AI pintar menyusun kata dan pola, bukan “mengerti” seperti manusia. Ia sangat meyakinkan saat salah. Tetap perlukan nalar & verifikasi manusia. (Video menunjukkan fokus ke mekanisme prediksi berikutnya bukan kebenaran faktual absolut)

2) Konteks itu raja
Hasil baik lahir dari konteks yang jelas: siapa peran AI, apa tujuan, batasan, dan format. Bahasa prompt yang jernih = perhatian (attention) tepat sasaran. (Selaras dengan konsep attention yang memilih info paling relevan.)

3) Skala besar ≠ selalu jawaban
Lebih besar sering lebih ampuh, tapi butuh biaya dan tidak menghapus bias. Gunakan AI dengan ukuran & cara yang proposional dengan tugas.

4) Praktik aman & sehat pakai AI (untuk pemula):

Jaga privasi: jangan tempel data rahasia.
Verifikasi: cek fakta penting untuk keputusan serius, wajib second opinion.
Jejak jelas: simpan catatan prompt & versi hasil.
Red-flag rutin: jika hasil terlalu mulus, cek ulang sumber & angka.

5) Cara mulai yang membumi:

Pakai AI untuk ringkas email/dokumen & bikin daftar ide.
Minta outline presentasi, lalu isi detailnya.
Minta contoh format template lalu sesuaikan.
Latihan cek-fakta: tanyakan sumber, bandingkan manual.
Buat daftar “boleh/tidak” pribadi (apa yang aman diproses AI).

Sikap ke depan:

Pro-human, pro-tool: gunakan AI untuk mempercepat draft awal, brainstorming, atau penjelasan konsep, finalisasi tetap di tangan kita.
Jika ingin memahami mendalam belajarlah sedikit demi sedikit: pahami istilah inti (token, embedding, attention, softmax). Cukup untuk naik kelas literasi AI.
Ikuti arsitektur, bukan hype: tahu bahwa lompatan besar AI modern datang dari transformer (2017) dan sifatnya yang paralel menolong untuk memilah mana klaim pemasaran, mana kemajuan arsitektural nyata.