หุ่นยนต์เล่นโป๊กเกอร์ใหม่ล่าสุดได้รับการพัฒนาโดยนักวิจัยกลุ่มเดียวกับที่นำเสนอ Libratus ในปี 2560 คราวนี้เอาชนะทีมผู้เล่นโป๊กเกอร์ชั้นนำในเกม NLHE 6 มือได้สำเร็จ Facebook ทำงานร่วมกับนักวิจัยจาก Carnegie Mellon University ซึ่งนำโดยศาสตราจารย์ Tuomas Sandholm ของ CMU และนักศึกษาระดับบัณฑิตศึกษา Noam Brown และผลการวิจัยที่ตีพิมพ์เมื่อต้นเดือนนี้ในวารสาร Science ก็น่าทึ่งมาก บอทสามารถเอาชนะคู่ต่อสู้ซึ่งเป็นสิ่งที่ AI อื่นไม่เคยทำได้ (โปรแกรม AI ก่อนหน้านี้สามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) ผลของโครงการนี้คาดว่าจะมีผลกระทบอย่างมากต่อการวิจัย AI และเกมโป๊กเกอร์เอง Two TrialsPoker ถือเป็นเกมที่มีความท้าทายของข้อมูลที่เป็นความลับค่อนข้างดีนักวิจัยจึงใช้มันเป็นความท้าทายในการสร้างและพัฒนาปัญญาประดิษฐ์ อย่างไรก็ตามไม่มีเครื่องจักรใดที่สามารถเอาชนะผู้เล่นที่เป็นมนุษย์ในสภาพแวดล้อมเท็กซัสโฮลเอ็มแบบไม่ จำกัด ผู้เล่นหลายคน (รูปแบบการเล่นโป๊กเกอร์ที่ได้รับความนิยมมากที่สุด) จนกระทั่ง Pluribus เข้ามา Pluribus ต่อสู้กับมือโปรโป๊กเกอร์ที่ดีที่สุดในรูปแบบ NLHE สูงสุด 6 รูปแบบ ผู้เชี่ยวชาญเป็นผู้เชี่ยวชาญสูงสุด 6 คนที่มีรายได้อย่างน้อย 1 ล้านเหรียญจากอาชีพโป๊กเกอร์มืออาชีพ พลูริบัสผ่านการทดลองสองครั้งที่แตกต่างกัน ในการทดลองครั้งแรกมนุษย์ห้าคนและ AI (5H + 1AI) หนึ่งตัวถูกวาดต่อกันในขณะที่ในการทดลองครั้งที่สองมีเพียงมนุษย์เพียงคนเดียวเท่านั้นที่ต้องเผชิญกับร่างโคลนของพลูริบัส 5 ตัว (1H + 5AI) โดยพิจารณาว่าไม่อนุญาตให้ใช้บอท พวกเขาไม่รู้ว่าจะสื่อสารอย่างไรและกำลังเล่นกับใครจึงหลีกเลี่ยงการสมรู้ร่วมคิดใด ๆ ผลชัยชนะของ Pluribus จากการทดลองทั้งสองครั้งพบว่าอัตราการชนะของ Pluribus นั้นสูงกว่าอย่างมีนัยสำคัญเมื่อเทียบกับผู้เล่นโป๊กเกอร์ที่เป็นมนุษย์ นักแสดงบางคนที่เข้าร่วมการทดลอง ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, Jacob Toole, Jason Les, Jimmy Chou, Linus Loeliger, Michael Gagliano, Nick Petrangelo, Sean Ruane, Seth Davies และ Trevor Savage ใช้ชื่อเล่นระหว่างเกม ในการทดลอง 5H + 1AI มีการเล่นทั้งหมด 10,000 มือเป็นเวลา 12 วันในขณะที่ผู้เล่นโป๊กเกอร์คาร์เรนอีเลียสและคริสเฟอร์กูสันเล่น 5,000 มือต่อสำเนาพลูริบัส 5 ชุดในการทดสอบ 1H + 5AI เมื่อคำนวณผลลัพธ์ปรากฎว่าหุ่นยนต์สามารถเอาชนะมนุษย์ได้ประมาณ 5 เหรียญต่อมือและประมาณ 1,000 เหรียญต่อชั่วโมงตามบล็อกโพสต์ Facebook AI ของ Noam Brown วิดีโอสาธิต Pluribus และข้อดี: ผู้เชี่ยวชาญโป๊กเกอร์คิดอย่างไรเกี่ยวกับ AI Pluribus นี่คือสิ่งที่ผู้เข้าร่วมการทดลองพูดถึงบอทโป๊กเกอร์ล่าสุด Seth Davies: “มุมมองที่ให้กำลังใจมากที่สุดในการเล่นกับ Pluribus คือการตอบสนองต่อกลยุทธ์การปัดก่อนที่ซับซ้อนซึ่งแตกต่างจากมนุษย์ Pluribus ใช้มิติการเลี้ยงหลายแบบใน pre-flop การพยายามตอบสนองต่อช่วงเปิดที่ไม่ใช่เชิงเส้นถือเป็นความท้าทายที่สนุกสนานแตกต่างจากมนุษย์ เกม. ” Jason Les: “นี่คือสัตว์ประหลาดที่บลัฟฟ์แน่นอนฉันจะบอกว่านี่เป็นการบลัฟฟ์ที่มีประสิทธิภาพมากกว่าคนส่วนใหญ่และนั่นคือสิ่งที่ทำให้ยากที่จะเล่นกับมันคุณมักจะโทษคุณภายใต้แรงกดดันมากมายจาก AI และคุณ รู้ว่ามันอาจจะทำให้สับสนที่นี่ “จิมมี่โชว:” ทุกครั้งที่ฉันเล่นบอทฉันรู้สึกว่าฉันพบสิ่งใหม่ ๆ ที่จะรวมเข้ากับเกมของฉันในฐานะคนอื่น ๆ ฉันคิดว่าเรามักจะย่อขนาดเกมเพื่อตัวเราเองทำให้ง่ายต่อการ ใช้และจดจำกลยุทธ์บอทไม่ยอมรับทางลัดใด ๆ เหล่านี้และมีความซับซ้อน / สมดุลอย่างยิ่งสำหรับทุกการตัดสินใจมีโครงสร้างเกม “คริสเฟอร์กูสัน:” พลูริบัสเป็นคู่ต่อสู้ที่เล่นยากมากมันยากที่จะน็อค เขาลงไปแล้วเขายังทำได้ดีมากในการเดิมพันมูลค่าต่ำในแม่น้ำเขาเก่งมากที่ได้รับคุณค่าจากมือที่ดีของเขา ” Darren Elias: “มันเป็นแค่ตัวฉันและจากนั้นก็มีบอทโป๊กเกอร์ AI ห้าเวอร์ชันที่ฉันจะเล่นกับมือนับพันทุกวันมันพัฒนาเร็วมากตั้งแต่ผู้เล่นระดับปานกลางไปจนถึงผู้เล่นระดับแนวหน้าโดยทั่วไปแล้วผู้เล่นโป๊กเกอร์ใน ไม่กี่วันและหลายสัปดาห์มันค่อนข้างน่ากลัว “Pluribus สำหรับตอนนี้มันปลอดภัยที่จะบอกว่าหนึ่งในผู้เล่นโป๊กเกอร์ที่ดีที่สุดในโลกไม่ใช่ใบหน้าของโป๊กเกอร์ แกนหลักหรือกลยุทธ์แผนของพลูริบัสถูกสร้างขึ้นโดยการเล่นเองหรือแข่งขันกับร่างโคลนของมันเอง นี่เป็นวิธีการเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมของเครือข่ายประสาทเทียม 5 เครือข่ายที่มีการฝึกอบรมเทียบเท่า 45,000 ปีและสามารถเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 ได้ พลูริบัสสอนตัวเองตั้งแต่เริ่มต้นโดยใช้สายพันธุ์ การเรียนรู้แบบเสริมกำลังเช่นเดียวกับ AlphaZero ที่ใช้โดย Go AI ของ DeepMind เริ่มต้นด้วยการเล่นโป๊กเกอร์แบบสุ่มและวิวัฒนาการตามที่กำหนดว่าการกระทำใดจะได้รับเงินมากขึ้น หลังจากเล่นแต่ละมือเขาจำได้ว่ามันเล่นอย่างไรและแทนที่จะยึดติดกับการเดิมพันเขาคิดว่าถ้าเขาสามารถทำเงินได้มากขึ้นด้วยการกระทำที่แตกต่างกันเช่นการเพิ่ม หากทางเลือกนำไปสู่ผลลัพธ์ที่ดีกว่าเขามักจะเลือกทางเลือกนั้นในสถานการณ์ในอนาคต พลูริบัสเล่นโป๊กเกอร์มือเป็นล้านล้านกับเขาโดยพัฒนากลยุทธ์พื้นฐานที่เขาทำตามในการแข่งขัน พลูริบัสเปรียบเทียบสถานการณ์ของเกมกับแผนของเขาสำหรับการตัดสินใจแต่ละครั้งที่เขาทำและคาดเดาล่วงหน้าสองสามขั้นตอนเพื่อดูว่าเกมจะออกมาเป็นอย่างไร จากนั้นเขาจะตัดสินใจว่าจะปรับปรุงได้หรือไม่ Pluribus ใช้กลยุทธ์การเรียนรู้ด้วยตนเองหลายอย่างซึ่งผู้เล่นที่เป็นมนุษย์ไม่ควรใช้ ความสำเร็จของพลูริบัสส่วนใหญ่เกิดจากประสิทธิภาพ เมื่อเล่นโป๊กเกอร์จะทำงานบนหน่วยประมวลผลกลาง (ซีพียู) สองหน่วยเท่านั้นซึ่งแตกต่างจาก Go bot ดั้งเดิมซึ่งใช้ซีพียูเกือบ 2,000 ตัวเมื่อ CPU 100 ตัวของ Libratus และผู้เล่นมืออาชีพระดับสูงของ DeepMind เอาชนะได้ เมื่อพลูริบัสเล่นกับตัวเองในเวลาประมาณ 20 วินาทีเขาเล่นมือได้เร็วกว่าผู้เล่นมืออาชีพประมาณสองเท่า สิ่งที่ยอดเยี่ยมอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์ที่มีราคาเพียง 144 เหรียญในการทำงาน จากการเปรียบเทียบ Libratus ใช้พลังงานจากซูเปอร์คอมพิวเตอร์มูลค่า 9.65 ล้านดอลลาร์ซึ่งมีราคาแพงมากในการทำงาน แน่นอนว่าการทดลองนี้ไม่ได้จบลงแค่โป๊กเกอร์ แม้ว่าความสามารถในการเอาชนะนักโป๊กเกอร์มืออาชีพที่เก่งที่สุดในเกมหกมือถือเป็นความสำเร็จที่ยิ่งใหญ่ แต่ก็แสดงให้เห็นว่าพลังในการคำนวณอาจมีจุดประสงค์อื่นที่ไม่ใช่การเล่นไพ่ จากข้อมูลของ Brown ผลการวิจัยดังกล่าวตอกย้ำความจริงที่ว่า AI สามารถทำงานในระดับ ‘เหนือมนุษย์’ ในสถานการณ์ที่มีการ จำกัด การเข้าถึงหัวข้อและข้อมูลที่หลากหลายและสามารถนำไปใช้ได้ทุกที่ตั้งแต่วาณิชธนกิจและกลยุทธ์การเจรจาไปจนถึงเทคโนโลยียานยนต์ไร้คนขับ ตอนนี้ Pluribus กำลังเข้าร่วมในเกมอย่าง Chess and Go ซึ่งเป็นสองเกมที่ผู้เล่นที่เป็นมนุษย์ที่ดีที่สุดในโลกพ่ายแพ้ด้วยปัญญาประดิษฐ์ ที่มา: https: //science.sciencemag.org/content/early/2019/07/10/science.aay2400


คาสิโน ออนไลน์888
ทางเข้า คาสิโน
คาสิโน 1688
คาสิโน 1988
คาสิโน ทรูวอลเล็ต