เจมินี (แบบจำลองภาษา)
เจมินี (Gemini) เป็นชุดของแบบจำลองภาษาที่พัฒนาโดยดีปไมด์ ของกูเกิล ถือเป็นผู้สืบทอดของ LaMDA และ PaLM 2 ประกอบไปด้วย Gemini Ultra, Gemini Pro และ Gemini Nano (ประกาศเมื่อวันที่ 6 ธันวาคม 2023) และถือเป็นคู่แข่งกับ GPT-4 ของ OpenAI
ประวัติศาสตร์
การพัฒนา
กูเกิล ประกาศพัฒนาเจมินี ซึ่งเป็นแบบจำลองภาษาขนาดใหญ่ (LLM) ที่พัฒนาโดยดีปไมด์ บริษัทในเครือ ในระหว่างปาฐกถาพิเศษของกูเกิล ไอโอ เมื่อวันที่ 10 พฤษภาคม 2023 เจมินีถูกวางตำแหน่งให้เป็นผู้สืบทอดที่ทรงพลังกว่า PaLM 2 (ซึ่งเปิดตัวในงานเดียวกัน) แม้ว่าสุนทร ปิจาอี ประธานเจ้าหน้าที่บริหาร จะระบุว่าเจมินียังอยู่ในช่วงเริ่มต้นของการพัฒนา[ 1] [ 2]
แตกต่างจากแบบจำลองภาษาขนาดใหญ่อื่น ๆ ก่อนหน้า ซึ่งได้รับการฝึกเฉพาะแค่จากคลังข้อความ ตัวแบบเจมินีนั้นได้รับการฝึกโดยการเรียนรู้แบบพหุฐานนิยม นั่นคือฝึกโดยใช้ทั้งข้อความ, รูปภาพ , เสียงพูด, วิดีโอ รวมไปถึงรหัสต้นทาง ของโปรแกรมคอมพิวเตอร์[ 3] [ 4] ได้รับการพัฒนาโดยความร่วมมือระหว่างดีปไมด์และ กูเกิลเบรน ซึ่งเป็น 2 แผนกของกูเกิลที่ได้รวมเข้าด้วยกัน[ 5]
ในการให้สัมภาษณ์กับนิตยสาร Wired เดมิส แฮสซาบิส ประธานเจ้าหน้าที่บริหารของดีปไมด์ กล่าวว่าเขามีความมั่นใจว่ากูเกิลจะสามารถใช้ LaMDA และ บาร์ด เอาชนะแชตจีพีที ซึ่งขับเคลื่อนโดย GPT-4 ของ OpenAI ได้ เขายังกล่าวว่าเจมินีจะรวมพลังของอัลฟาโ AlphaGo และแบบจำลองภาษาขนาดใหญ่อื่น ๆ ของดีปไมด์ เข้าด้วยกัน โดยสร้างจากจุดแข็งของโปรแกรม AlphaGo ของดีปไมด์ (ซึ่งได้รับความสนใจทั่วโลกเมื่อเอาชนะแชมป์หมากล้อม อย่างอี เซ-ดล ในปี 2016)[ 6]
ในเดือนสิงหาคม 2023 เว็บไซต์ The Information [en ] เผยแพร่รายงานสรุปแผนงานของกูเกิลสำหรับเจมินี โดยเปิดเผยว่าบริษัทตั้งเป้าที่จะเปิดตัวในช่วงปลายปี 2023 ตามรายงานกูเกิลจะรวมความสามารถด้านข้อความสนทนาที่พบในแบบจำลองภาษาขนาดใหญ่ส่วนใหญ่เข้ากับการสร้างภาพที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ เพื่อสร้างภาพตามบริบทและปรับให้เข้ากับกรณีการใช้งานที่กว้างขึ้น และต้องการมีประสิทธิภาพเหนือกว่า OpenAI และคู่แข่งรายอื่น[ 7]
เซอร์เกย์ บริน ซึ่งเป็นผู้ร่วมก่อตั้งกูเกิลก็ได้ถูกเรียกตัวให้มาช่วยพัฒนาเจมินี[ 8] พร้อมด้วยวิศวกรอีกหลายร้อยคนจากกูเกิลเบรนและดีปไมด์[ 7] [ 9] เจมินียังได้รับการฝึกให้ถอดเสียงวิดีโอ จาก YouTube อีกด้วย จึงมีการนำทนายความเข้ามาช่วยเพื่อลบเนื้อหาที่อาจติดลิขสิทธิ์ออก[ 7]
หลังจากข่าวการเปิดตัวของเจมินี ทาง OpenAI จึงรีบรวมความสามารถแบบพหุฐานนิยมเหมือนอย่างในเจมินีเข้าไว้ใน GPT-4[ 10] ในรายงานของเว็บไซต์ The Information เดือนกันยายนระบุว่า บริษัทหลายแห่งได้รับอนุญาตให้เข้าถึงเวอร์ชันเริ่มต้นของแบบจำลองภาษาขนาดใหญ่ที่กูเกิลตั้งใจที่จะให้บริการแก่ลูกค้าผ่านบริการ Vertex AI ของกูเกิลคลาวด์ รายงานยังระบุด้วยว่ากูเกิลกำลังระดมกำลังเต็มที่เพื่อให้เจมินีเอาชนะทั้ง GPT-4 และ GitHub Copilot ของไมโครซอฟท์ [ 11] [ 12] เมื่อวันที่ 2 ธันวาคม นิตยสารรายงานว่าทางกูเกิลได้เลื่อนการเปิดตัวเจมินีจากสัปดาห์ถัดไปไปเป็นเดือนมกราคม 2024 เนื่องจากยังมีปัญหาการใช้งานข้อความพร้อมรับที่ไม่ใช่ภาษาอังกฤษ และจะมีการจัดกิจกรรมการเปิดตัวเพิ่มเติมอีก 3 รายการในนิวยอร์ก , วอชิงตัน ดี.ซี. และ แคลิฟอร์เนีย [ 13] [ 14]
การเปิดตัว
เมื่อวันที่ 6 ธันวาคม 2023 ปิจาอีและแฮสซาบิสได้ประกาศ Gemini 1.0 ในงานแถลงข่าว[ 15] [ 16] มีการประกาศสามรุ่น: Gemini Ultra ออกแบบมาสำหรับ "งานที่ซับซ้อนสูง" Gemini Pro ออกแบบมาสำหรับ "งานที่หลากหลาย" และ Gemini Nano ออกแบบมาสำหรับ "งานบนอุปกรณ์" เมื่อเปิดตัว Gemini Pro และ (Gemini) Nano ได้รวมเข้ากับสมาร์ทโฟน Bard และ Pixel 8 Pro ตามลำดับ ในขณะที่ Gemini Ultra ช่วยเสริมความสามารถให้กับ Bard Advanced และพร้อมใช้งานสำหรับนักพัฒนาซอฟต์แวร์ในต้นปี 2024 ผลิตภัณฑ์อื่น ๆ ที่ Google ตั้งใจจะบรรจุเจมินีเข้าไปได้แก่ กูเกิล เสิร์ช , กูเกิล แอดเวิดส์ , กูเกิล โครม ,Duet AI บน กูเกิล เวิร์กสเปซ และ AlphaCode [en ] [ 17] [ 16] โดยในตอนแรกมีให้บริการเป็นภาษาอังกฤษเท่านั้น[ 16] [ 18]
ทางกูเกิลอ้างว่าเจมินีเป็น "แบบจำลองปัญญาประดิษฐ์ที่ใหญ่ที่สุดและมีความสามารถมากที่สุด" ซึ่งออกแบบมาให้เลียนแบบพฤติกรรมของมนุษย์[ 19] [ 16] [ 20] และกล่าวว่าเจมินีจำเป็นต้องมีการตรวจสอบด้านความปลอดภัยมากจนทำให้ยังไม่สามารถใช้งานอย่างกว้างขวางได้จนกว่าจะถึงปีหน้า[ 15] เจมินีได้รับการฝึกฝนและขับเคลื่อนโดยหน่วยประมวลผลเทนเซอร์ (TPU) ของกูเกิล[ 15] [ 18] และตั้งชื่อรวมระหว่าง DeepMind กับ Google Brain และ โครงการเจมินี ของ NASA [ 21]
มีรายงานว่า Gemini Ultra มีประสิทธิภาพเหนือกว่า GPT-4, Claude2 ของ Anthropic , Inflection2 ของ Inflection AI [en ] และ LLaMA2 ของเมตา และ กร็อก ของ xAI ในเกณฑ์มาตรฐานอุตสาหกรรมต่าง ๆ[ 22] [ 15] ในขณะเดียวกัน Gemini Pro ได้รับการรายงานว่ามีประสิทธิภาพเหนือกว่า GPT-3.5 [ 4] Gemini Ultra ยังเป็นแบบจำลองภาษาแรกที่ทำได้ดีกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ และได้คะแนน 90% จากแบบทดสอบ MMLU ใน 57 วิชา[ 4] [ 21]
ในวันที่ 13 ธันวาคม 2024 Gemini Pro จะพร้อมใช้งานสำหรับลูกค้ากูเกิลคลาวด์ ใน AI Studio และ Vertex AI ในขณะที่ Gemini Nano จะพร้อมใช้งานสำหรับนักพัฒนาแอนดรอยด์ [ 23] [ 24] [ 25]
แฮสซาบิสเปิดเผยเพิ่มเติมว่าดีปไมด์กำลังหาวิธีการใช้เจมินีเพื่อ "รวมเข้ากับหุ่นยนต์เพื่อโต้ตอบทางกายภาพ"[ 26] ทางกูเกิลกล่าวว่าจะแบ่งปันผลการทดสอบ Gemini Ultra กับรัฐบาลกลางสหรัฐ ตามคำสั่งประธานาธิบดี 14110 ที่ลงนามโดยประธานาธิบดีโจ ไบเดิน ในเดือนตุลาคม ทางบริษัทยังได้หารือกับ รัฐบาลสหราชอาณาจักร เพื่อปฏิบัติตามหลักการที่กำหนดไว้ในงานประชุมสุดยอดความปลอดภัยเอไอ (AI Safety Summit) ซึ่งจัดขึ้นที่เบลชลีพาร์ก ในเดือนพฤศจิกายน[ 4]
อ้างอิง
↑ Grant, Nico (May 10, 2023). "Google Builds on Tech's Latest Craze With Its Own A.I. Products" . The New York Times . ISSN 0362-4331 . เก็บ จากแหล่งเดิมเมื่อ May 10, 2023. สืบค้นเมื่อ August 21, 2023 .
↑ Ortiz, Sabrina (May 10, 2023). "Every major AI feature announced at Google I/O 2023" . ZDNet . เก็บ จากแหล่งเดิมเมื่อ May 10, 2023. สืบค้นเมื่อ August 21, 2023 .
↑ Wankhede, Calvin (June 4, 2023). "What is Google Gemini: The next-gen language model that can do it all" . Android Authority . เก็บ จากแหล่งเดิมเมื่อ June 5, 2023. สืบค้นเมื่อ August 21, 2023 .
↑ 4.0 4.1 4.2 4.3 Milmo, Dan (December 6, 2023). "Google says new AI model Gemini outperforms ChatGPT in most tests" . The Guardian . ISSN 0261-3077 . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Levy, Steven (September 11, 2023). "Sundar Pichai on Google;s AI, Microsoft's AI, OpenAI, and ... Did We Mention AI?" . Wired . เก็บ จากแหล่งเดิมเมื่อ September 11, 2023. สืบค้นเมื่อ September 12, 2023 .
↑ Knight, Will (June 26, 2023). "Google DeepMind's CEO Says Its Next Algorithm Will Eclipse ChatGPT" . Wired . เก็บ จากแหล่งเดิมเมื่อ June 26, 2023. สืบค้นเมื่อ August 21, 2023 .
↑ 7.0 7.1 7.2 Victor, Jon (August 15, 2023). "How Google is Planning to Beat OpenAI" . The Information . เก็บ จากแหล่งเดิมเมื่อ August 15, 2023. สืบค้นเมื่อ August 21, 2023 .
↑ Grant, Nico (January 20, 2023). "Google Calls In Help From Larry Page and Sergey Brin for A.I. Fight" . The New York Times . ISSN 0362-4331 . เก็บ จากแหล่งเดิมเมื่อ January 20, 2023. สืบค้นเมื่อ February 6, 2023 .
↑ Kruppa, Miles; Seetharaman, Deepa (July 21, 2023). "Sergey Brin Is Back in the Trenches at Google" . The Wall Street Journal . ISSN 0099-9660 . เก็บ จากแหล่งเดิมเมื่อ July 21, 2023. สืบค้นเมื่อ September 7, 2023 .
↑ Victor, Jon (September 18, 2023). "OpenAI Hustles to Beat Google to Launch 'Multimodal' LLM" . The Information . เก็บ จากแหล่งเดิมเมื่อ September 18, 2023. สืบค้นเมื่อ October 15, 2023 .
↑ "Google nears release of AI software Gemini, The Information reports" . Reuters . September 14, 2023. เก็บ จากแหล่งเดิมเมื่อ September 15, 2023. สืบค้นเมื่อ October 2, 2023 .
↑ Nolan, Beatrice (September 23, 2023). "Google is quietly handing out early demos of its GPT-4 rival called Gemini. Here's what we know so far about the upcoming AI model" . Business Insider . เก็บ จากแหล่งเดิมเมื่อ September 23, 2023. สืบค้นเมื่อ October 16, 2023 .
↑ Victor, Jon; Efrati, Amir (December 2, 2023). "Google Preps Public Preview of Gemini AI After Postponing In-Person Launch Events" . The Information . เก็บ จากแหล่งเดิมเมื่อ December 2, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Tangalakis-Lippert, Katherine (December 2, 2023). "Google has quietly pushed back the launch of next-gen AI model Gemini until next year, report says" . Business Insider . เก็บ จากแหล่งเดิมเมื่อ December 3, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ 15.0 15.1 15.2 15.3 Kruppa, Miles (December 6, 2023). "Google Announces AI System Gemini After Turmoil at Rival OpenAI" . The Wall Street Journal . ISSN 0099-9660 . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ 16.0 16.1 16.2 16.3 Liedtike, Michael; O'Brien, Matt (December 6, 2023). "Google launches Gemini, upping the stakes in the global AI race" . Associated Press . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Edwards, Benj (December 6, 2023). "Google launches Gemini—a powerful AI model it says can surpass GPT-4" . Ars Technica . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ 18.0 18.1 Pierce, David (December 6, 2023). "Google launches Gemini, the AI model it hopes will take down GPT-4" . The Verge . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Fung, Brian; Thorbecke, Catherine (December 6, 2023). "Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT" . CNN Business . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ "Google launches Gemini, upping the stakes in the global AI race" . CBS News . December 6, 2023. เก็บ จากแหล่งเดิมเมื่อ December 7, 2023. สืบค้นเมื่อ December 7, 2023 .
↑ 21.0 21.1 Knight, Will (December 6, 2023). "Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT" . Wired . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Henshall, Will (December 6, 2023). "Google DeepMind Unveils Its Most Powerful AI Offering Yet" . Time . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Metz, Cade; Grant, Nico (December 6, 2023). "Google Updates Bard Chatbot With 'Gemini' A.I. as It Chases ChatGPT" . The New York Times . ISSN 0362-4331 . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Elias, Jennifer (December 6, 2023). "Google launches its largest and 'most capable' AI model, Gemini" . CNBC . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023 .
↑ Alba, Davey; Ghaffary, Shirin (December 6, 2023). "Google Opens Access to Gemini, Racing to Catch Up to OpenAI" . Bloomberg News . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 7, 2023 .
↑ Knight, Will (December 6, 2023). "Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI" . Wired . เก็บ จากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 7, 2023 .