🎞️ Videos → Web MCP นี่ Real หรือ Cake
Description
คุณตั้ง Chief Product Officer จาก Wisesight จะพามาทำความรู้จักกับ Web MCP ซึ่งเป็นมาตรฐานการเชื่อมต่อรูปแบบใหม่ที่ตั้งเป้าจะปรับเปลี่ยนวิธีที่ AI ทำงานร่วมกับเว็บไซต์ ปัจจุบัน AI browser มักอาศัยการอ่าน HTML หรือถ่าย screenshot ซึ่งกินทรัพยากร ทำงานช้า เปลือง token และมีความเสี่ยงปัญหาด้านความปลอดภัย เทคโนโลยี Web MCP จึงเข้ามาช่วยแก้ปัญหาโดยให้นักพัฒนาเว็บสามารถประกาศ tool ผ่านรูปแบบ imperative หรือ declarative เพื่อให้ agent รับรู้และเลือกเรียกใช้ได้เฉพาะฟังก์ชันที่อนุญาต คุณตั้งจะมาบรรยายถึงจุดเริ่มต้นของโปรเจกต์นี้ พร้อมสาธิตการทำงานเบื้องต้น ไปจนถึงชวนคิดวิเคราะห์แนวโน้มในอนาคตว่ามาตรฐานดังกล่าวจะถูกนำมาใช้งานอย่างแพร่หลายจริงหรือไม่ รวมถึงแบ่งปันแง่มุมการปรับตัวของคนทำงานในวงการสายเทคโนโลยี เมื่อ AI เริ่มมีความสามารถสูงขึ้นและเข้ามาทดแทนการทำงานต่างๆ ได้อย่างรวดเร็ว
Chapters
- เกริ่นนำและแนะนำตัวผู้บรรยาย 0:00
- MCP คืออะไร: มาตรฐานตัวกลางที่ช่วยให้ AI Agent เรียก API ได้เป็นระบบ 1:17
- สำรวจตลาด AI Browser และจุดเริ่มต้นความจำเป็นของ Web MCP 3:13
- ปัญหาความอืดและกิน Token จากการไถอ่าน HTML และสแนปภาพหน้าเว็บของ AI 4:15
- ช่องทางมาตรฐาน Web MCP: แกัปัญหากวนใจด้าน Security และ Privacy ของเว็บ 6:09
- เริ่มทดลองใช้งาน Web MCP บน Google Chrome ด้วย Flag Setting 7:46
- 2 วิธีการเปิดช่องทางให้ AI ใช้งาน Tools: รูปแบบ Imperative และ Declarative API 8:41
- Demo สาธิตการใช้งานจริง: เมื่อ AI อ่าน Tool การจองโต๊ะและกรอกฟอร์มอัตโนมัติ 10:48
- ทิศทาง Local API: พัฒนา AI บนเบราว์เซอร์ให้ประมวลผลจบภายในเครื่อง (On-device) 13:01
- ตอบข้อสงสัย: หากเบราว์เซอร์ต้องรันเว็บที่ไม่มีมาตรฐาน Web MCP จะทำอย่างไร? 14:37
- มุมมองส่วนตัว: ถ้าโมเดล AI ฉลาดและแม่นยำขึ้น มาตรฐานนี้อาจลดความสำคัญลง 17:13
- ความกังวลเรื่อง AI แย่งคนทำงาน และข้อคิดการใช้ชีวิตท่ามกลางเทคโนโลยีที่คาดเดาไม่ได้ 19:56
Transcript
คำบรรยายต่อไปนี้อาจไม่ถูกต้องทั้งหมด หากคุณพบข้อผิดพลาดใดๆ คุณสามารถคลิกเมาส์ขวาบนข้อความเพื่อรายงานได้ทันที หรือ แก้ไขบน GitHub
เกริ่นนำและแนะนำตัวผู้บรรยาย0:00
ตบมือครับ แปะๆๆๆๆๆ สวัสดีครับๆ สวัสดีครับคนทำเว็บครับ
ตอนแรกกะว่า… ขอขิงเท่ ๆ หน่อย ตอนแรกก็รู้สึกว่าขี้เกียจกดตั๋ว และก็อยากพูดคนต้น ๆ ก็นึกไม่ออกว่าทำไงดี ก็เลยจ่ายตังค์สปอนเซอร์งานไปครับ เท่ไหม? จ่ายแล้วโปรโมตได้เลยนะครับ เท่ไหม? เปล่า พูดเล่นนะครับ ไม่ได้รู้อะไร ก็แค่น้องอยากจะจัด ก็เลยแบบโอเค ก็อยากให้มันเกิดขึ้น เพราะหลายปีก่อนตอนสร้างขึ้นมา เราก็ยกให้พวกน้อง ๆ ไป
เพราะไม่ไหวครับ งานชีวิตก็ไม่ไหวแล้ว ก็สวัสดีครับ ชื่อตั้งครับ ปัจจุบันเป็น Chief Product Officer อยู่ที่ Wisesight นะครับ งานประจำไม่ได้เขียนโค้ดครับ ใช้ปากด่าคนอย่างเดียวครับ แต่ว่ากลับบ้านก็ยังเขียนเล่น ๆ ขำ ๆ ครับ ก่อนอื่นเลยนะครับ ช่วยตาม TikTok นะครับ หนูอยากเป็น TikToker นะครับ กด follow พี่เขาได้นะครับ ก็ทุกอาทิตย์นะครับ จะมีคลิปเล่าเรื่อง feature ใหม่ ๆ ทุก ๆ อาทิตย์เกี่ยวกับเว็บนะครับ อาทิตย์นี้ถ้าจำไม่ผิดจะเป็น Web MCP นี่แหละ เพราะฉะนั้น ข้ามไปได้เลยนะครับ ไม่ต้องดู เพราะว่าเหมือนกับที่จะกำลังพูดนะครับ โอเค ก่อนอื่นเลย ข้ามไปนิดนึงก่อน
MCP คืออะไร: มาตรฐานตัวกลางที่ช่วยให้ AI Agent เรียก API ได้เป็นระบบ1:17
ใครไม่รู้จัก MCP บ้างครับ?
ถ้าพอรู้อยู่แล้วก็จะข้ามยาว ๆ เลย
กลับไปก็คือ พอเราเข้าใจว่า MCP มันคืออะไร คอนเซปต์มันก็ง่ายมากเนอะ คือมันแปลง API หรืออะไรก็ตาม ให้อยู่ใน format ที่เป็น standard format ถ้าจะมองมันก็เหมือน RESTful ไหม? ก็แล้วแต่คนมองเนาะ มันก็จะเป็น format ที่เรียกแบบนี้นะ มี information แบบนี้ เพื่อให้ agent เรียกได้ง่าย ๆ แต่ปัญหามันคือ เวลาเราพูดถึง MCP มันก็จะเป็น backend-based ซะเยอะ เป็น API-based ล่าสุดเป็น Cowork เนาะ ก็เริ่มมีเป็นในเชิงแอป เป็น command line ซะเยอะ แต่คำถามคือ แล้วเว็บล่ะ? แล้วถ้า agent จะคุยกับเว็บล่ะ มันคุยยังไง?
มันก็เลยมีคนดำริว่า เราปล่อยให้ทุกอย่างมันมั่วแบบนี้ไม่ได้
เราสร้างมาตรฐานนึงขึ้นมาดีกว่า เพื่อให้ AI มันคุยกับเว็บได้ง่าย ๆ
ก็เลยเป็นที่มาของ Web MCP ครับ ต้องเล่าว่าเมื่อสักตอน 5-6 เดือนก่อน อยู่ดี ๆ ในกลุ่ม GDE กันเอง ในกลุ่ม Google Developer Expert ก็คุยกันเรื่องนี้ว่า อยู่ดี ๆ มันมี repo แปลก ๆ โผล่ขึ้นมา
organization หนึ่งที่ชื่อ Web Machine Learning ชื่อตัว repo คือ Web2Calling อยู่ดี ๆ โผล่ขึ้นมาเลย ฟึ้บ เราก็แบบ เชี่ยไรเนี่ย แล้วจังหวะที่มันโผล่คือเราอยู่ใน meeting กับ Google ก็มีคนถามขึ้นมา เขาก็หน้าตาเลิ่กลั่ก แล้วเขาก็บอกว่า เรายังไม่ขอคุยเรื่องนี้ตอนนี้
เดี๋ยวค่อยว่ากัน และหลังจากนั้นมา ก็เริ่มมียิง meeting ขึ้นมานั่งคุยกัน เราก็เริ่มรู้แล้วว่า โอเค อนาคตเนี่ยมันน่าจะมีสิ่งนี้ เราก็ตามมาเรื่อย ๆ นะครับ โอเค ข้ามไปเลยละกัน
สำรวจตลาด AI Browser และจุดเริ่มต้นความจำเป็นของ Web MCP3:13
คราวนี้เรามาพูดเรื่องว่าทำไมเราต้องมี Web MCP บ้าง เอาง่าย ๆ ก่อนเลย ทุกวันนี้เรามี AI browser นี่โคตรเยอะเลย เรามี Comet มี Atlas ใช่ไหมครับ
ใครใช้ Comet อยู่บ้างครับ? 1 คน ใครใช้ Atlas บ้างครับ? อ้าว แม่งตายแล้วเหรอ? โอเค ใครใช้ Claude ที่เป็น extension อยู่บ้างครับ?
ใครใช้พวก Manus หรืออะไรบ้างที่เป็น extension มีไหม? เมื่อกี้เพิ่งเล่านะครับ ผมใช้ Manus AI คำถามคือ ทำไมถึงใช้ อ๋อ เผลอกด subscription ไป แล้วมันเป็นรายปี ก็เลยแบบรีบ ตอนนั้นสั่งงานอยู่แล้วรีบ
ขี้เกียจ สายตาวูบ ๆ ๆ ๆ จะเติม token ลืมดูว่าเป็นรายปี แม่งตัดบัตรมา เชี่ย แม่งตัดมาแล้ว กำลังจะ refund เฮ้ย งานแม่งเจนออกมาดีว่ะ งั้นเก็บไว้ก่อน เพราะฉะนั้นถ้าใครถาม เห็นผมใช้ Manas อ๋อ ไม่ได้อยากใช้นะครับ พอดีจ่ายรายปีเอาไว้ แล้วขี้เกียจ refund นะครับ
ปัญหาความอืดและกิน Token จากการไถอ่าน HTML และสแนปภาพหน้าเว็บของ AI4:15
คราวนี้กลับมาที่เรื่องของเราครับ ถามว่าแล้ว browser พวกนี้เวลาเล่นเว็บมันทำยังไง มันก็ไต่ HTML ไปเรื่อย ๆ ครับ take screenshot เดี๋ยวผมให้ดูง่าย ๆ อย่างตอนนี้ผมใช้ Claude เนอะ
สมมติว่าผมจะไปญี่ปุ่น ไม่สมมติละครับ เรื่องจริงเลย
ผมก็อยากหาร้านราเมงสักร้านใน Osaka ใช่ไหมครับ สมมติผมบอกว่า เอาใหม่ โอเค I want to find best ramen in Osaka.
นี่สิ่งที่มันทำคือ ถ่าย screenshot แล้วก็นั่งดู กูมี element อะไรที่กดได้บ้าง แล้วกูก็กดไปเรื่อย ๆ ครับ และเราก็นั่งรอไป ในความเป็นจริงมันแดก token ฉิบหายเลยถูกไหม? เพราะว่า พอมันเป็น screenshot สิ่งที่มันทำคืออะไรครับ มันสกรีนเป็นรูปไหม? ไม่ แม่ง capture HTML ยัดลงไปเลยเป็น context เพราะฉะนั้นมันก็จะ take time แล้วเราก็นั่งรอไปเรื่อย ๆ นี่คือสิ่งที่เกิดขึ้น แล้วคำถามคือ เฮ้ย แล้วตอนนี้คนอื่นทำยังไง ก็ทำท่าเดียวกันครับ ก็ทำท่าเดียวกันแบบนี้ ทุกคน ทุก browser พอเราทำแบบนี้ปุ๊บ ปัญหาที่ user จะเจอก็คือ 1 คือ แม่งช้าครับ
2 คือ ค่าชาร์จ token เราก็จะสูงด้วย service เราก็จะสูง เพราะว่าถ้าแบบเก็บเป็นเครดิต แม่งก็กินเครดิต นึกออกไหม ช้า ไม่แม่นอีก เพราะว่าแม่งไปกดห่าอะไรไม่รู้ โอเคล่ะ มันอาจจะกดถูกก็ได้ แต่ว่ามันก็จะฉิบหายในวันนึงอยู่ดี คำถามคือ เราจะปล่อยให้แม่งไถเว็บกูไปเรื่อย ๆ เหรอ
แล้วทำไปถึงเมื่อไหร่นะ เมื่อไหร่มันจะจบนะ
ช่องทางมาตรฐาน Web MCP: แกัปัญหากวนใจด้าน Security และ Privacy ของเว็บ6:09
ถ้าเป็นแบบสายฝรั่งหน่อยก็จะพูดว่า แล้ว security and privacy concern จะทำยังไงล่ะ ซึ่งไม่มีอยู่ในกูนะครับ กูขายชีวิตให้ของพวกนี้ไปหมดแล้วนะครับ security อย่างแรกคือ สมมติเราทำเว็บอ่ะ เราก็ทำเว็บกันดี ๆ ถูกไหม เขียนโค้ดก็ดี ๆ ถูกไหม ถ้าแม่งเสือกกดนู่นกดนี่ พลาดโป้ง บั๊กแดก เว็บพัง อ่า เยี่ยม very good สุดยอด ยิ่งโค้ดดี ๆ อยู่ ถูกไหมครับ privacy concern ถ้ามันไป scrape เอา data บางอย่าง ที่เราไม่อยากให้ออกมาล่ะจะทำยังไง
Chrome เองบอก ไม่ กูไม่ทำ กูไม่ยอม เพราะฉะนั้น Chrome ไม่มีการจะ scrape หน้าเว็บ แบบไม่ยอม take action เป็นอันขาด scrape แค่ information อย่างเดียว ไม่ take action อะไรเลย สำหรับ Gemini on Chrome ในอเมริกา ซึ่งยังใช้ไม่ได้ในไทยนะครับ ก็เลยมีคนบอกว่า พอกันทีไอ้ชีวิตเหี้ย ๆ แบบนี้ เราก็เลยจะสร้างมาตรฐานที่บอกว่า ถ้า browser จะคุยกับเว็บ มึงคุยผ่านรูนี้เท่านั้น ห้ามคุยผ่านรูอื่นเป็นอันขาด ตัว web developer จะเป็นคนประกาศบอก AI browser เอง ว่ามีรู 1 2 3 4 5 6 7 8 9 10 ให้ใช้ รูอื่นห้ามเข้า
เขาก็เลยสร้างมาหลายมาตรฐานมากในช่วงแรก ๆ
พอทำเสร็จปุ๊บ มันไปจบกันตรงที่ว่า เฮ้ย โลกเราอ่ะมันใช้ MCP กันแล้ว งั้นก็ทำสิ่งที่เรียกว่า Web MCP ขึ้นมาสิ จะได้จบ ๆ ไป มันก็เลยเป็นที่มาของ Web MCP ครับ ซึ่งคนนำเนี่ย Microsoft Microsoft Microsoft Google Google ก็คือ Microsoft และ Google ครับ ที่จะทำสิ่ง ๆ นี้
เริ่มทดลองใช้งาน Web MCP บน Google Chrome ด้วย Flag Setting7:46
โอเค พอผมเห็น repo นี้ repo นี้โผล่ขึ้นมาจริง ๆ ช่วงประมาณ August
แล้วก็สักสองสามอาทิตย์ก่อน มั้ง สองอาทิตย์ก่อนอะไรประมาณนี้ครับ ก็มีอีเมลส่งมาในกลุ่มของ early preview AI ของ Chrome
อันนี้ไม่ NDA หรอก เพราะว่าแม่งแจกกันทุกคนนะครับ เขาบอกว่า Web MCP มาแล้ว ลองไหม ผมแม่งแบบ เชี่ย แม่งมาจริงว่ะ ก็เลยเข้าไปดู spec ครับ ว่ามันทำอะไรได้ สิ่งที่ Web MCP ทำ มัน
ถ้าใครใช้ MCP อยู่แล้ว โคตร simple เลยครับ
ก่อนอื่นถ้าจะเล่น ณ เวลานี้ครับ เข้าไปเปิด flag ก่อน ชื่อ WebMCP for Testing อันนี้แม่งเพิ่งมาเมื่อวาน ไม่รู้คืออะไร เดี๋ยวค่อยไปดู แต่มันมี 2 อัน อันล่างครับ WebMCP for Testing
2 วิธีการเปิดช่องทางให้ AI ใช้งาน Tools: รูปแบบ Imperative และ Declarative API8:41
หน้าตามันอย่างนี้เลยครับ หน้าตามันจะมี 2 แบบครับ แบบแรกเรียกว่า imperative. Imperative คือ คุณแค่ประกาศว่าคุณมี tool อะไรบ้าง
ประกาศแบบ MCP อ่ะ name, description อะไร, input schema อะไร แล้วมันจะ execute อะไร ประกาศ register ปุ้ง! เดี๋ยวนี้ปุ๊บ browser จะรู้เลย เพราะฉะนั้นมันไม่ได้ประกาศทิ้งไว้ก่อนครับ มันสามารถประกาศแบบ on the fly เดี๋ยวนี้ได้ เช่น เกิด event นี้ค่อย register tool นี้ แล้วก็ unregister ทิ้งได้เลย เพราะฉะนั้น เนี่ย browser เนี่ย จะสามารถ take action ได้เลย เช่น อ๋อ มี 10 tool ให้ใช้ใช่ไหม? งั้นกู โอเค เลือกจาก 10 tool เนี่ยแล้วกูก็ใช้ เพราะฉะนั้น AI มันก็ใช้งานเหมือน MCP ธรรมดาที่มี 10 tool เลือกให้ถูก ก็แค่นั้น ถูกไหมครับ? นี่คือแบบแรก แบบที่สอง อันนี้ ดูน่าแฮปปี้กว่านิดหนึ่ง มันคือเรียกว่า declarative API ครับ คือการประกาศเลยว่า form เนี้ย กูเป็น tool
กูเป็น tool ชื่อนี้ มี tool description แบบนี้ แล้วเดี๋ยวมันก็ไปงมอยู่ในนี้เอง ก็อาจจะดูแปลกหน่อย แต่ก็ง่ายหน่อยสำหรับคนที่ทำเว็บ ถูกไหมครับ? ไม่จำเป็นที่ต้องมานั่ง config อะไรมาก ถูกไหม? โอเค ฝั่ง JavaScript event เนี่ย เราก็สามารถ detect ได้ว่า โอเค tool มันถูก trigger แล้วนะ tool มันถูก cancel แล้วนะ จังหวะที่ browser มัน trigger หรือ cancel ขึ้นมา เราก็ detect ได้หมด เพราะฉะนั้นก็จะเห็นว่ามันดูไม่ได้วุ่นวายมากเท่าไหร่ ทุกคนก็จะรู้สึกว่า อ๋อ ดีจังเลย ง่ายหน่อยแล้ว โปรแกรมเมอร์ ถ้าสมมติว่ากลับไปที่ไอ้หน้าเมื่อกี้ แทนที่จะต้องให้มันวิ่งไป search ปุ๊บ ก็ลองคิดง่าย ๆ ว่าเว็บนี้ก็แค่ provide tool ตัวหนึ่งขึ้นมา แล้วไอ้ tool อันนี้
agent เจอ ปุ๊บ agent ก็หยิบมันออกมาใช้ ก็แค่นั้นเอง คราวนี้ผมจะพาไปดู demo กันครับ
Demo สาธิตการใช้งานจริง: เมื่อ AI อ่าน Tool การจองโต๊ะและกรอกฟอร์มอัตโนมัติ10:48
ว่ามันหน้าตาประมาณไหน โอเค ขอนั่งนิดหนึ่งนะครับ อันนี้เป็นเว็บ demo นะครับ ผมยังไม่ได้ทำ demo ของตัวเองขึ้นมานะครับ อันนี้ขอใช้ demo ของ Google ก่อน ขออนุญาตแป๊บหนึ่งนะครับ ไม่ได้ใส่ geminiKey ไว้เหรอ แป๊บหนึ่งนะครับ พอดีว่า deactivate ไอ้นี่ทิ้งไปวันก่อน
deactivate ตัว extension ทิ้งไป มันเลยไม่เห็น geminiKey อยู่นะครับ
เอาออกมาสักอันแล้วกัน ผมกดไม่รู้ อ๋อ โอเค เดี๋ยวผมไปเอาในโน้น
แป๊บนึงนะครับ ขอโทษทีที่ดึงสาย ไม่เป็นไรครับ กูทำให้ทุกอย่างดูยากขึ้นอีกแล้ว ไม่เป็นไรครับ โอเค
โอเค
อันเนี้ย มันมี extension ตัวหนึ่งครับ
ลอง search ก็ได้ครับว่า WebMCP Model Context Inspector อะไรเงี้ยครับ สิ่งที่มัน inspect เจอเนี่ย ก็คือเว็บเนี้ย expose ทูลออกมาตัวหนึ่งครับ สั่ง register ทูลออกมาตัวหนึ่ง คือทูลที่ชื่อว่า โห แม่งดูยากฉิบหาย ที่ชื่อว่า bookTable
อ่ะ ตอนนี้ browser รู้แล้วว่า อ๋อ กูมี ทูล นี้อยู่ ก็เขียนแบบ MCP ธรรมดา ใครเขียน MCP ไม่เป็น ไปลองอ่านนะครับ มันไม่ได้ format ยาก หลังจากนั้น พอ user พิมพ์ prompt ปุ๊บ พอคลิก send สิ่งที่มันทำก็คือ มันก็จะไปเรียก AI generate tool calling pattern ออกมา แล้วก็ inject กลับ ปุ๊บ มันก็ fill form เลยครับ
มันเหมือนเราเปิด JavaScript function เอาไว้อันหนึ่ง ให้ AI เรียก แล้วบอกว่า มึงอย่าเสือกไปใช้อันอื่น มึงมาใช้อันนี้ เพราะฉะนั้นเนี่ย มันก็จะเป็นคอนเซปต์ประมาณนี้ คราวนี้ผม experiment ไปต่อนิดนึง
ทิศทาง Local API: พัฒนา AI บนเบราว์เซอร์ให้ประมวลผลจบภายในเครื่อง (On-device)13:01
เวลาเราพูดถึง browser เนี่ย เวลาเราพูดถึง AI บน browser เนี่ยครับ เราก็จะคิดถึง AI แบบเวอร์ชัน cloud เนาะ ซึ่งนี่ก็ cloud ถูกป่ะ เมื่อกี้ก็ต้องไปกรอก API key แต่ในความเป็นจริง แม่งโคตรไม่ effective เลย ถูกไหม การทำ AI เรียก cloud ลงมาเนี่ย แม่งโคตรไม่ effective บางทีงานโง่ ๆ แบบเช่น ช่วยหาร้านอาหารให้หน่อย บางทีแบบมึงไปเรียก cloud ทำไม ถูกไหมครับ? เวลาสมมติว่าเราลอง imagine ว่ามันเป็น
แบบที่เป็น local API ครับ อันนี้คือ prompt API ของ Chrome ที่โมเดลเป็นโมเดล local นะครับ โมเดลเป็น on-device นะครับ ทำแบบเดียวกันเลยครับ
Book 2 seats tonight.
My name is Brian.
ตึง อ่า โอเค คราวนี้ ทุกอย่างมันก็จะจบในเครื่อง แป๊บนึงนะครับ มันจะใช้เวลาแป๊บนึง อ่า ตึง แล้วมันก็ สมมติว่า parameter ตัวไหนไม่พอ มันก็จะบอกให้เราไปกรอกเอง อะไรอย่างเงี้ย ซึ่งอันนี้ โมเดลเนี้ย process ในเครื่อง ในอนาคตเวลาเราใช้พวก AI ที่เป็น browser เนี่ย สิ่งที่มันควรจะเป็นคือ AI ทั้งหมดถูก process ในเครื่อง เพราะอินเทอร์เน็ตช้าอีก ค่า token ด้วย ถูกไหมครับ? ลองคิดง่าย ๆ ว่าโอ้โห เราต้องจ่ายขนาดไหนอ่ะ เพื่อจะมา cover พวกเครดิตพวกนี้ นี่ก็เป็นคอนเซปต์เร็ว ๆ เลยครับ ของ WebMCP ที่เราคิดว่าในอนาคตมันก็คงมาแน่นอนนะครับ
ตอบข้อสงสัย: หากเบราว์เซอร์ต้องรันเว็บที่ไม่มีมาตรฐาน Web MCP จะทำอย่างไร?14:37
โอเค โห ผมใช้เวลาดีมาก เพราะตอนแรกผมคิดว่าเขาให้พูด 15 นาที
โอเค คำถามคือ มันจะมีคนใช้ไหมนะ แล้วมันจะเป็นยังไง เพราะตอนนี้ก็ Google กับ Microsoft ใช่ป่ะ สองคนเป็นคนทำ แล้วอนาคตมันจะ widely used ไหม
คำตอบผม
มีคำถามมากมายครับ อย่างแรกคือ แล้วถ้า dev ไม่เปิดเอาไว้ล่ะ browser จะทำยังไง มันก็จะมี browser บางคนที่พูดว่า ไม่ กูจะไม่เข้าถึงอะไรที่ dev ไม่เปิดเอาไว้ มันก็จะมีบางคนที่บอกว่า ไม่ ไม่เปิด กูก็ลอกมึงอยู่ดี ถูกไหม? แล้วคำถามคือ แล้วเว็บที่ไม่มี WebMCP อ่ะ แล้วมันจะทำยังไงอ่ะ แบบไม่จำเป็นต้องมีอ่ะ แบบเว็บ WordPress เงี้ย
แล้วจะไป get content ทำไงอ่ะ?
เราก็จะรู้สึกว่า แม่งมี use case ที่ไม่จำเป็นเยอะมากเลย แล้วก็นึกไม่ออกด้วยว่า
สุดท้ายแล้วไอ้เว็บที่เปิดบ้างไม่เปิดบ้างอ่ะ สมมติกลับไปที่ Tabelog เมื่อกี้อ่ะ บอกว่า อ่ะ มีให้ search แต่กูไม่ให้ filter บางอย่าง แต่ user ต้องการอ่ะ มันจะทำยังไง คำตอบของผมคือ สุดท้ายมันก็จะมีทั้งคู่ล่ะครับ
แล้วเดี๋ยว browser มันก็จะเลือกเอาเองล่ะว่าใช้อะไร ใครที่ implement เอาไว้ มันก็จะไปใช้ทางนั้นก่อน ถ้ามันได้ result ที่โอเค มันก็ มันก็จะใช้ ส่วนถ้าใครไม่ได้ implement เอาไว้ มันก็คงไถเหมือนเดิมนะครับ
ส่วน browser อะไรจะเอาบ้าง เนี่ย ก็ยังตอบยาก เนาะ เพราะว่าในอนาคตเองเราก็ ถึงเราจะบอกว่า agentic browser ทุกวันนี้เป็น Chromium-based ก็ตามอ่ะนะครับ แต่ก็ไม่รู้ว่าทุกคนจะ implement ไปด้วยกันหรือเปล่าเนาะ อย่าง Comet เอง หรือพวก Chrome extension เอง มันก็เป็น Chrome-based อยู่แล้วอ่ะ เราก็เชื่อว่าทุกเจ้าก็คงทำแบบนี้แน่นอน
ส่วนตัวเรานะ ส่วนตัวเราเชื่อว่า WebMCP จะถูก launch เป็นมาตรฐานที่พยายามให้ทุกคน apply เนี่ย ภายในกลางปีนี้ ดูจาก sign อะไรหลาย ๆ อย่างละกัน คิดว่ากลางปีนี้ ทุก ๆ อย่างเนี้ย จะถูกให้เป็น early previews แล้วเราจะเริ่มเห็นเว็บมากขึ้น ในอนาคต browser ก็อาจจะ support มากขึ้น Chrome เองก็อาจจะ support หรือ Microsoft เอง Copilot ก็อาจจะ support แต่ถ้าถาม opinion แบบ opinion มาก ๆ
มุมมองส่วนตัว: ถ้าโมเดล AI ฉลาดและแม่นยำขึ้น มาตรฐานนี้อาจลดความสำคัญลง17:13
จอนี้มันจะไม่เห็นนะ ต้องจอนี้ เพราะกลัวโดนมากเลยฉิบหาย สุดท้ายอ่ะเราเชื่อว่าพอโมเดลมัน effective ขึ้นอ่ะครับ แม่งก็น่าจะไม่มีคนใช้แล้วก็ตายห่าอยู่ดีนะครับ
อย่าเอาไปบอก Google นะครับ เดี๋ยวแม่งด่ากู
ไม่เป็นไรครับ ไม่เป็นไร มันไม่น่าจะชัดมากอยู่แล้ว บนจอ เห็นไหม ขาวจั๊ว มึงพูดอะไรวะเนี่ย ไอ้บ้า กูไม่รู้ ลืมแล้ว ถูกไหม? โอเค ช่างมัน ๆ มันแปลไทยไม่ได้ โอเค และไม่รู้สิ เราลึก ๆ
เราไม่ค่อยเชื่อว่ามันจะแบบ widely widely use ขนาดนั้นอ่ะ เราอยู่ในยุคที่เป็น PWA มานาน สุดท้ายเราก็รู้สึกว่า feature ที่ specific สำหรับ PWA
progressive web app อ่ะ มันก็ไม่ได้เยอะขนาดนั้น มันก็กลายเป็น normal feature ของเว็บอ่ะ แล้วเมื่อก่อนคนคิดว่าการเข้า URL ของเว็บ เนี่ยเป็นเรื่องวุ่นวายมาก ๆ เลย แต่ก็ไม่รู้เหมือนกันว่าทำไมทุกวันนี้ คนไม่ได้ expect ที่จะต้อง add to screen อ่ะ ก็แค่เปิดมา พิมพ์ URL ก็จำได้อยู่แล้วอ่ะครับ เพราะฉะนั้น ถามว่าวันนี้เราเห็น PWA use case เยอะขนาดนั้นไหม ก็
มันก็เป็นเว็บอ่ะ มันก็ไม่ได้มีใคร add to screen ขนาดนั้น และผมก็เชื่อว่า วันหนึ่งถ้าโมเดลมัน ปัญหา ก็ต้องบอกว่า ปัญหาของ WebMCP มัน ส่วนหนึ่งมันออกมาแก้เพราะอะไร context size มันใหญ่ถูกไหม? ต้องมานั่ง capture ต้องมานั่งนั่นนี่ ถ้าวันหนึ่งโมเดลมันฉลาดพอที่จะกดแม่น ๆ และ efficient สูง ๆ ก็ไม่จำเป็นต้องเข้าถูกทางก็ได้ เหมือน ไม่ต้องอะไรมาก วันนี้ WebMCP ที่เป็นแบบ semantic มาก ๆ บนโมเดล ทุกคนก็บอกไปเขียน skill สิ ซึ่งถ้าใครเขียน skill จะรู้ดีว่า มึงเขียนเป็นวิทยานิพนธ์เลยเหี้ย
มึง efficient มากกว่าไอ้เหี้ยนั่นได้ยังไงนะ แต่ทุกคนก็บอกไปเขียน skill สิ อ่านง่ายกว่า แต่ในฐานะคนเขียนโปรแกรมจะรู้สึกว่า มึงบ้าป่ะ เขียน skill เนี่ยนะ มึง... เหี้ยอะไรวะเนี่ย แล้วคำถามคือ แล้ว skill จะเรียก script ยังไง อ๋อ มึงก็เขียน script เป็น .py วางไว้ในโฟลเดอร์ รวม ๆ กัน ฮะ เหี้ยอะไรนะ
คือเรายังนึกไม่ออกเลยว่าเรื่องพวกนี้เกิดขึ้นได้ยังไงนะ ในวันที่เรารู้สึกว่าเราทำงานเป็น semantic มาก ๆ แบบ จะเอา A หรือเอา B จะเอา pattern แบบนี้ ก็ต้องเป็น JSON แบบนี้ แล้วมาแปะรวมกัน ในวันนี้เราเขียนเป็น format ได้ เราก็เชื่อว่าในวันหนึ่งโมเดลมันก็ ถ้าโมเดลมัน catch up ทัน อะไรที่เป็น semantic มาก ๆ ในวันนี้ที่เราเห็นกันน่ะ มันก็คงเลือนหายไปเรื่อย ๆ เพราะฉะนั้นก็ลอง ๆ มาเถอะครับ
ความกังวลเรื่อง AI แย่งคนทำงาน และข้อคิดการใช้ชีวิตท่ามกลางเทคโนโลยีที่คาดเดาไม่ได้19:56
เราก็ไม่รู้ว่าอะไรเหมือนกัน เรายังไม่รู้เลยว่า สิ้นปีเราจะมีงานทำกันหรือเปล่า ถูกไหมครับ? เรายังไม่รู้เลยว่าเราจะต้องหัดทำอย่างอื่น เช่น เลี้ยงแมว
AI แย่งงานใช่ไหมครับ? เชื่อพี่เถอะ มันแย่งโหดกว่าที่เราคิด
คือ ย้อนกลับไปเมื่อปีที่แล้ว เราเชื่อว่าโอ๊ย มันไม่ขนาดนั้นหรอกมั้ง อะไรอย่างเงี้ย เราขายซอฟต์แวร์ให้กับลูกค้า marketing ลูกค้า business
มีลูกค้าบางเจ้าเดินมาบอกว่า ขออัปแพ็กหน่อย กับซอฟต์แวร์ที่ใช้ เราก็ถามว่า อ๋อ โอเคครับ พี่ใช้เยอะขึ้นเหรอ อ๋อ เปล่า พี่ layoff ทีมนั้นทิ้งไปแล้ว เหลือคนเดียว จะได้จากเดิมที่ต้องใช้คนทำเยอะ ๆ ก็จ่ายซอฟต์แวร์มากขึ้น แล้วเดี๋ยวให้คนนั้นทำคนเดียว
หรือแบบเดี๋ยวพี่จะเอา call center ออกสัก 25% แล้วใช้ chatbot แทน — ก็คือใช้เหมือน STT speech to text แล้วก็ feed เข้า AI แล้วให้ AI พูดแทนคน? เราเชื่อว่าคนจะน้อยลงละกัน เพราะฉะนั้นเราก็เชื่อว่า อะไรก็เกิดขึ้นได้ครับ cowork เงี้ย ใครจะไปรู้อ่ะ 4-5 เดือนที่แล้วไม่มีเลย แม่งอาทิตย์ที่แล้วมา 4-5 ตัว นึกออกป่ะ เมื่อกี้เพิ่งเปิดบทความ 73 feature ภายใน 52 วัน
Anthropic 73 feature ภายใน 52 วัน เพราะฉะนั้น อะไรใหม่ เล่นไปเถอะครับ เพราะเราก็ไม่รู้เหมือนกันว่าจะอยู่นานขนาดไหน และใครที่บอกได้ว่าอนาคตจะเป็นอย่างนี้ อย่าเชื่อแม่งมากครับ
และไม่ใช่กูคนหนึ่งล่ะที่กูจะบอกด้วยว่าอนาคตเป็นยังไง ใครจะถามว่า พี่คิดว่าอนาคตข้างหน้าเป็นไง กูไม่รู้ครับ ตามนั้นครับ ใช้ชีวิตตื่นมากินข้าวให้อิ่มพอแล้วครับ ขอบคุณครับ