CTO Google Cloud, Will Grannis Memprediksi 3 Gen AI di Tahun 2024

Admin Januari 12, 2024 Teknologi Comment

Google setiap tahun google melakukan refleksi untuk memprediksi perubahan khususnya perubahan besar yang dibawa oleh AI ke dalam perusahaan, budaya global, dan dunia yang lebih luas. Tujuannya untuk mempertimbangkan apa yang diperlukan untuk memanfaatkan AI secara maksimal di organisasi, institusi dan perusahaan.

Will Grannis, CTO Google Cloud, berbagi prediksinya tentang hal-hal yang diperlukan untuk memanfaatkan gen AI secara maksimal tahun ini, dan cara melakukannya dengan aman, terjamin, berkelanjutan, dan secara kreatif.

Bagi organisasi di mana pun, kegembiraan AI pada tahun 2023 dengan cepat memberi jalan pada sesuatu yang lebih menarik dan bermanfaat: hasil bisnis yang didukung AI yang penting. Alasannya mencakup kemajuan terkini dalam kemampuan AI di seluruh tumpukan komputasi yang memungkinkan organisasi di industri, geografi, atau fase pertumbuhan apa pun untuk mengakses potensi yang biasanya hanya dimiliki segelintir orang. Dengan banyaknya orang yang bekerja dengan kemampuan baru ini, diharapkan banyak inovasi dan hasil.

Rangkaian model seperti Gemini dari Google adalah ekspresi terkuat dari terobosan awal AI generatif, yang memungkinkan manusia dan perangkat berinteraksi dalam bahasa alami manusia. Komputer yang dipandu oleh dorongan manusia mensintesis data dalam jumlah yang tak terbayangkan untuk mencerna informasi, membuat prediksi, membantu tugas, atau membuat konten baru, mulai dari teks hingga gambar hingga kode komputer baru. Gemini mengambil langkah lebih jauh dari sebelumnya sebagai model multimoda asli pertama di dunia.

Catatan:

Gemini adalah model bahasa besar multimodal yang dikembangkan oleh Google DeepMind, yang berfungsi sebagai penerus LaMDA dan PaLM 2. Terdiri dari Gemini Ultra, Gemini Pro, dan Gemini Nano, diumumkan pada 6 Desember 2023, diposisikan sebagai pesaing GPT-4 OpenAI. Google mengumumkan Gemini, model bahasa besar (LLM) yang dikembangkan oleh anak perusahaan Google DeepMind, dalam event keynote Google I/O pada 10 Mei 2023, yang juga diluncurkan CEO Google Sundar Pichai

Gemini dikatakan unik karena tidak dilatih pada korpus teks saja dan dirancang untuk menjadi multimodal , artinya dapat memproses beberapa jenis data secara bersamaan, termasuk teks, gambar, audio, video, dan kode komputer. Program ini dikembangkan sebagai kolaborasi antara DeepMind dan Google Brain, dua cabang Google yang telah digabungkan menjadi Google DeepMind pada bulan sebelumnya

Setelah momen “wow” di tahun 2023, banyak perusahaan menghadapi pertanyaan, “Apa pengaruhnya bagi bisnis kita, dan berapa biayanya?” Sebagai chief technology officer Google Cloud, Will Grannis memahami arah perkembangan teknologi (konvergensi asisten AI, platform, dan infrastruktur), dan bagaimana beberapa organisasi terkemuka di dunia telah memanfaatkannya. Secara umum, Grannis melihat tiga pilar utama yang akan memengaruhi cara perusahaan memahami, menerapkan, dan menggunakan gen AI pada tahun 2024: ekonomi dan energi, keberadaan dan akses, serta kepercayaan dan keamanan.

Ekonomi dan energi

Kelangsungan hidup gen AI dalam suatu perusahaan seringkali berpusat pada biaya-biaya utama, baik dari segi finansial maupun lingkungan hidup. Eksekusi yang disiplin akan memuaskan kehidupan finansial bisnis dan semakin pentingnya kepatuhan terhadap peraturan dan kewarganegaraan perusahaan.

Gen AI menggunakan komputasi yang sangat besar, dengan biaya dan tantangan sosial seputar penggunaan energi. Pelanggan akan memerlukan pengetahuan tentang cara pengelolaan energi untuk pusat data dan fleksibilitas untuk mengoptimalkan produksi menggunakan wilayah dan zona yang paling bersih . Hal ini kemungkinan besar akan mempengaruhi praktik penulisan perangkat lunak dan mungkin menerapkan penganggaran karbon sebagai bagian dari praktik pengembang. Pelanggan ingin kami melanjutkan upaya keberlanjutan yang signifikan , dan dapat dipastikan bahwa permintaan dan pentingnya generasi AI yang berkelanjutan akan meningkat pada tahun 2024.

Model bahasa besar, atau LLM , yang mendukung AI memerlukan pelatihan yang efisien, penyesuaian, inferensi, dan manajemen siklus hidup. Kurva biaya menuntut pelaksanaan yang terfokus dan berprinsip, terutama seiring dengan meningkatnya skala proyek. Itulah salah satu alasan mengapa kami membangun infrastruktur AI yang dioptimalkan untuk mendukung Vertex, platform AI andalan kami.

Google memasukkan AI ke dalam penelusuran pada tahun 2015. Dengan merasakan langsung tantangan perluasan AI ini — dan mengetahui bahwa secara historis, 50% atau lebih biaya perangkat lunak adalah pemeliharaan, termasuk penyempurnaan — menjadikan efisiensi sebagai prioritas awal kami. Jadi kami mengembangkan Tensor Processing Units (TPU), yaitu chip khusus yang menangani beban kerja AI, termasuk gen AI, dengan biaya yang jauh lebih rendah dan penggunaan energi yang lebih baik . Menjadi pengelola dana investasi pelanggan yang langka dan pasokan energi global yang terbatas merupakan prioritas yang tidak dapat dinegosiasikan bagi semua organisasi modern.

Keberadaan dan akses

Bagi banyak orang, pengalaman pertama dengan gen AI akan berupa produk seperti alat untuk mengubah database lama menjadi produk baru dan lebih canggih, asisten untuk membantu mengelola kehidupan kerja Anda, atau bot yang menawarkan jawaban berkualitas tinggi atas pertanyaan medis. Semua ini bertumpu pada paradigma komputasi baru yang menggunakan lebih banyak data, dari lebih banyak sumber, dan dengan cara yang lebih fleksibel. Informasi dalam penagihan rumah sakit, misalnya, dapat dikumpulkan untuk mengetahui tren kesehatan nasional atau digunakan untuk melacak berapa lama waktu yang dibutuhkan untuk memberikan layanan di berbagai lokasi, untuk mengetahui kekurangan perawat.

Hal semacam ini akan mungkin terjadi dengan menggunakan model dan alat dasar yang tepat , bahkan dalam organisasi dengan staf dan sumber daya yang terbatas. Karena gen ini sudah ada dan ada di mana-mana, gen AI tidak berarti model, melainkan pengalaman yang bermanfaat dan mungkin ajaib.

Ada juga permasalahan dalam memastikan gen AI dapat diakses dan bermanfaat bagi semua orang di pasar, tidak hanya untuk beberapa perusahaan raksasa. Alat dan platform harus memungkinkan siapa saja untuk memulai AI secara efisien dan bertanggung jawab , dan hal ini harus mudah ditemukan dan ditampilkan. Beberapa hal akan menjadi kabur, termasuk perpindahan yang lebih mulus antara lingkungan eksperimen berbasis web ke lingkungan yang kuat dan mendukung platform dengan keamanan dan jaminan yang kuat.

Selain itu, gen AI akan mengubah banyak perangkat lunak dari produk generik menjadi produk yang disesuaikan dengan kebutuhan dan budaya setiap perusahaan, bahkan beradaptasi dengan pekerja dan pelanggan individu. Membumikan dan menyempurnakan LLM dengan data perusahaan yang dipatenkan memungkinkan konteks dan pengetahuan yang ada di perusahaan untuk mempertajam kinerja suatu model. Pengenalan teknik “ penyesuaian parameter yang efisien ” akan membuat penyesuaian ini jauh lebih realistis untuk organisasi yang lebih luas.

Kita akan melihat kemajuan pesat dalam penyulingan, ansambel, dan federasi (semua cara yang muncul untuk mempertajam keluaran model dengan lebih baik) serta alat pembuat konten baru yang akan membuka pengembangan bagi lebih banyak pekerja. Organisasi-organisasi di industri yang memiliki regulasi ketat, seperti keuangan dan layanan kesehatan, cenderung mengambil pendekatan yang lebih terkendali dibandingkan bisnis seperti game dan media.

Kepercayaan dan keamanan

Yang mendasari seluruh gangguan pada generasi AI adalah kebutuhan mendasar manusia dan organisasi akan kepercayaan terhadap penyedia layanan yang bertanggung jawab . Contoh layanan kesehatan di atas adalah ide yang menarik, namun hal ini memperkuat kebutuhan akan enkripsi data yang menyeluruh dan keamanan yang ditingkatkan AI untuk mengakses data di beberapa lokasi sekaligus, termasuk cloud dan sistem lokal yang berbeda, serta pemantauan biaya yang efektif.

Kemajuan terbaru kami yang berbasis di Gemini dalam hal produktivitas, deteksi ancaman, dan respons membawa gen AI ke garis depan keamanan perusahaan. Hal ini justru menggarisbawahi kenyataan bahwa ancaman tidak akan hilang dan mungkin akan memperoleh kemampuan yang didukung AI. Keamanan juga memerlukan alat AI generasinya sendiri , yang mampu mengenali dan menjelaskan ancaman dengan cara yang benar-benar baru. Model bahasa khusus domain kami, Sec-Palm 2 , dilatih dalam berbagai kasus penggunaan keamanan, yang mampu mengenali skrip yang berpotensi berbahaya secara instan dan mengingatkan tim akan ancaman aktif.

Sama seperti seseorang memutuskan apakah akan memercayai apa yang mereka lihat, dengar, dan baca berdasarkan perbandingan dengan apa yang mereka alami sebelumnya, organisasi juga akan mulai mengindeks apa yang mereka ketahui. Mereka kemudian dapat menjadikan pengetahuan dan data lebih mudah diakses dan berguna dalam penciptaan pengalaman, efisiensi, dan diferensiasi yang bertindak sebagai perpanjangan tangan terpercaya atas kredibilitas yang telah mereka peroleh dengan susah payah.

Memulai pada tahun 2024

Kita sekarang berada pada tingkat baru yang luar biasa dalam interaksi manusia-komputer. Ini semakin kuat bahkan semakin mudah digunakan, baik untuk pengembang individu maupun perusahaan. Kami yakin hal ini bukan berarti mengakhiri lapangan kerja, namun akan memberikan tuntutan baru terhadap kreativitas, kolaborasi, dan penemuan manusia yang sepadan dengan tantangan yang dihadapi dunia saat ini.

Pada tahun-tahun mendatang dan seterusnya, kita akan melihat gen AI menjadi lebih berguna, dengan transparansi yang lebih besar mengenai cara kerja, biaya, dan cara terbaik menerapkannya untuk menciptakan pengalaman terobosan. Dengan cara ini, hype akan memberi jalan pada nilai dan kesenangan yang tulus.

Banyak bisnis telah dimulai, dan yang lainnya ingin terlibat dengan AI. Ada banyak cara untuk belajar, mulai dari ikhtisar video dan dasar-dasar industri serta tutorial pelatihan atau kelas dan sertifikasi. Keterlibatan bisa sesederhana mencoba solusi out-of-the-box untuk kolaborasi atau dalam meningkatkan kinerja call center. Setelah Anda dan organisasi Anda melihat betapa mudahnya untuk memulai, saya yakin kreativitas Anda akan membuka lebih banyak kasus penggunaan dan pengalaman yang memajukan kita semua.

Oleh Will Grannis, CTO Google Cloud seperti yang disarikan catatannya pada google cloud.