31 January 2008

Geographic Information System

     ระบบสารสนเทศภูมิศาสตร์ (Geographic Information System : GIS) คือ กระบวนการทำงานเกี่ยวกับข้อมูลในเชิงพื้นที่ (spatial data) ด้วยระบบคอมพิวเตอร์ โดยการกำหนดข้อมูลเชิงบรรยาย (attribute data) และสารสนเทศ เช่น ที่อยู่ บ้านเลขที่ ที่มีความสัมพันธ์กับตำแหน่งในเชิงพื้นที่ เช่น ตำแหน่ง เส้นรุ้ง เส้นแวง ในรูปของ ตารางข้อมูล และ ฐานข้อมูล
     ระบบ GIS ประกอบไปด้วยชุดของเครื่องมือที่มีความสามารถในการเก็บรวบรวม รักษาและการค้นข้อมูล เพื่อจัดเตรียม ปรับแต่ง วิเคราะห์และการแสดงผลข้อมูลเชิงพื้นที่ เพื่อให้สอดคล้องตามวัตถุประสงค์การใช้งาน ซึ่งรูปแบบและความสัมพันธ์ของข้อมูลเชิงพื้นที่ทั้งหลาย จะสามารถนำมาวิเคราะห์ด้วย GIS ให้สื่อความหมายในเรื่องการเปลี่ยนแปลงที่สัมพันธ์กับช่วงเวลาได้ ใช้เป็นเช่น


  • การแพร่ขยายของโรคระบาด

  • การเคลื่อนย้ายถิ่นฐาน

  • การบุกรุกทำลาย

  • การเปลี่ยนแปลงของการใช้พื้นที่


     ข้อมูลเหล่านี้ เมื่อปรากฏบนแผนที่ทำให้สามารถแปล สื่อความหมาย และนำไปใช้งานได้ง่าย
     ข้อมูลใน GIS ทั้งข้อมูลเชิงพื้นที่และข้อมูลเชิงบรรยาย สามารถอ้างอิงถึงตำแหน่งที่มีอยู่จริงบนพื้นโลกได้โดยอาศัยระบบพิกัดทางภูมิศาสตร์ (geocode) ซึ่งจะสามารถอ้างอิงได้ทั้งทางตรงและทางอ้อม ข้อมูลใน GIS ที่อ้างอิงกับพื้นผิวโลกโดยตรง หมายถึง ข้อมูลที่มีค่าพิกัดหรือมีตำแหน่งจริงบนพื้นโลกหรือในแผนที่ เช่น ตำแหน่งอาคาร ถนน ฯลฯ สำหรับข้อมูล GIS ที่จะอ้างอิงกับข้อมูลบนพื้นโลกได้โดยทางอ้อมได้แก่ ข้อมูลของบ้าน (รวมถึงบ้านเลขที่ ซอย เขต แขวง จังหวัด และรหัสไปรษณีย์) โดยจากข้อมูลที่อยู่ เราสามารถทราบได้ว่าบ้านหลังนี้มีตำแหน่งอยู่ ณ ที่ใดบนพื้นโลก เนื่องจากบ้านทุกหลังจะมีที่อยู่ไม่ซ้ำกัน

องค์ประกอบของ GIS

     องค์ประกอบหลักของระบบ GIS จัดแบ่งออกเป็น 5 ส่วนใหญ่ ๆ คือ อุปกรณ์คอมพิวเตอร์ (hardware) โปรแกรม (software) ขั้นตอนการทำงาน (methods) ข้อมูล (data) และบุคลากร (people) โดยมีรายละเอียดของแต่ละองค์ประกอบดังต่อไปนี้

  1. อุปกรณ์คอมพิวเตอร์ คือ เครื่องคอมพิวเตอร์รวมไปถึงอุปกรณ์ต่อพ่วงต่าง ๆ เช่น ดิจิไทเซอร์ สแกนเนอร์ เครื่องพิมพ์ หรืออื่น ๆ เพื่อใช้ในการนำเข้าข้อมูล ประมวลผล แสดงผล และผลิตผลลัพธ์ของการทำงาน

  2. โปรแกรม คือชุดของคำสั่งสำเร็จรูป เช่น โปรแกรม Arc/Info, MapInfo ฯลฯ ซึ่งประกอบด้วยฟังก์ชัน การทำงานและเครื่องมือที่จำเป็นต่าง ๆ สำหรับนำเข้าและปรับแต่งข้อมูล, จัดการระบบฐานข้อมูล, เรียกค้น, วิเคราะห์ และ จำลองภาพ

  3. ข้อมูล คือข้อมูลต่าง ๆ ที่จะใช้ในระบบ GIS และถูกจัดเก็บในรูปแบบของฐานข้อมูล โดยได้รับการดูแลจากระบบจัดการฐานข้อมูลหรือ DBMS ข้อมูลจะเป็นองค์ประกอบที่สำคัญรองลงมาจากบุคลากร

  4. บุคลากร คือ ผู้ปฏิบัติงานซึ่งเกี่ยวข้องกับระบบสารสนเทศภูมิศาสตร์ เช่น ผู้นำเข้าข้อมูล ช่างเทคนิค ผู้ดูแลระบบฐานข้อมูล ผู้เชี่ยวชาญสำหรับวิเคราะห์ข้อมูล ผู้บริหารซึ่งต้องใช้ข้อมูลในการตัดสินใจ บุคลากรจะเป็นองค์ประกอบที่สำคัญที่สุดในระบบ GIS เนื่องจากถ้าขาดบุคลากร ข้อมูลที่มีอยู่มากมายมหาศาลนั้น ก็จะเป็นเพียงขยะไม่มีคุณค่าใดเลยเพราะไม่ได้ถูกนำไปใช้งาน อาจจะกล่าวได้ว่า ถ้าขาดบุคลากรก็จะไม่มีระบบ GIS

  5. วิธีการหรือขั้นตอนการทำงาน คือวิธีการที่องค์กรนั้น ๆ นำเอาระบบ GIS ไปใช้งานโดยแต่ละ ระบบแต่ละองค์กรย่อมีความแตกต่างกันออกไป ฉะนั้นผู้ปฏิบัติงานต้องเลือกวิธีการในการจัดการกับปัญหาที่เหมาะสมที่สุดสำหรับของหน่วยงานนั้น ๆ เอง


GIS ทำงานอย่างไร

     ภาระหน้าที่หลัก ๆ ของระบบสารสนเทศภูมิศาสตร์มีอยู่ด้วยกัน 5 อย่างดังนี้

  1. การนำเข้าข้อมูล (input) ก่อนที่ข้อมูลทางภูมิศาสตร์จะถูกใช้งานได้ในระบบสารสนเทศภูมิศาสตร์ ข้อมูลจะต้องได้รับการแปลง ให้มาอยู่ในรูปแบบของข้อมูล เชิงตัวเลข (digital format) เสียก่อน เช่น จากแผนที่กระดาษไปสู่ข้อมูลใน รูปแบบดิจิตอลหรือแฟ้มข้อมูลบนเครื่องคอมพิวเตอร์อุปกรณ์ที่ใช้ในการนำเข้าเช่น Digitizer Scanner หรือ Keyboard เป็นต้น

  2. การปรับแต่งข้อมูล (manipulation) ข้อมูลที่ได้รับเข้าสู่ระบบบางอย่างจำเป็นต้องได้รับการปรับแต่งให้เหมาะสมกับงาน เช่น ข้อมูลบางอย่างมีขนาด หรือสเกล (scale) ที่แตกต่างกัน หรือใช้ระบบพิกัดแผนที่ที่แตกต่างกัน ข้อมูลเหล่านี้จะต้องได้รับการปรับให้อยู่ใน ระดับเดียวกันเสียก่อน

  3. การบริหารข้อมูล (management) ระบบจัดการฐานข้อมูลหรือ DBMS จะถูกนำมาใช้ในการบริหารข้อมูลเพื่อการทำงานที่มีประสิทธิภาพในระบบ GIS DBMS ที่ได้รับการเชื่อถือและนิยมใช้กันอย่างกว้างขวางที่สุดคือ DBMS แบบ Relational หรือระบบจัดการฐานข้อมูลแบบสัมพัทธ์ (DBMS) ซึ่งมีหลักการทำงานพื้นฐาน ดังนี้คือ ข้อมูลจะถูกจัดเก็บ ในรูปของตารางหลาย ๆ ตาราง

  4. การเรียกค้นและวิเคราะห์ข้อมูล (query and analysis) เมื่อระบบ GIS มีความพร้อมในเรื่องของข้อมูลแล้ว ขั้นตอนต่อไป คือ การนำข้อมูลเหล่านี่มาใช้ให้เกิด ประโยชน์ เช่น ใครคือเจ้าของกรรมสิทธิ์ในที่ดินผืนที่ติดกับโรงเรียน? เมืองสองเมืองนี้มีระยะห่างกันกี่กิโลเมตร? ดินชนิดใดบ้างที่เหมาะสำหรับปลูกอ้อย? หรือ ต้องมีการสอบถามอย่างง่าย ๆ เช่น ชี้เมาส์ไปในบริเวณที่ต้องการแล้วเลือก (point and click) เพื่อสอบถามหรือเรียกค้นข้อมูล นอกจากนี้ระบบ GIS ยังมีเครื่องมือในการวิเคราะห์ เช่น การวิเคราะห์เชิงประมาณค่า (proximity หรือ buffer) การวิเคราะห์เชิงซ้อน (overlay analysis) เป็นต้น

  5. การนำเสนอข้อมูล (visualization) จากการดำเนินการเรียกค้นและวิเคราะห์ข้อมูล ผลลัพธ์ที่ได้จะอยู่ในรูปของตัวเลขหรือตัวอักษร ซึ่งยากต่อการตีความหมายหรือทำความเข้าใจ การนำเสนอข้อมูลที่ดี เช่น การแสดงชาร์ต (chart) แบบ 2 มิติ หรือ 3 มิติ รูปภาพจากสถานที่จริง ภาพเคลื่อนไหว แผนที่ หรือแม้กระทั้งระบบมัลติมีเดีย สื่อต่าง ๆ เหล่านี้จะทำให้ผู้ใช้เข้าใจความหมายและมองภาพของผลลัพธ์ที่กำลังนำเสนอได้ดียิ่งขึ้นอีก


ลักษณะข้อมูลในระบบสารสนเทศภูมิศาสตร์

     โลกมีความสลับซับซ้อนมากเกินกว่าที่จะเก็บข้อมูลทั้งหมดเกี่ยวกับโลกไว้ในรูปข้อมูลด้วยระบบคอมพิวเตอร์ จึงต้องเปลี่ยนปรากฏการณ์บน ผิวโลกจัดเก็บในรูปของตัวเลขเชิงรหัส (digital form) โดยแทนปรากฏการณ์เหล่านั้นด้วยลักษณะทางภูมิศาสตร์ที่เรียกว่า Feature

ประเภทของ Feature

     ลักษณะทางภูมิศาสตร์ที่เป็นตัวแทนของปรากฏการณ์ทางภูมิศาสตร์บนโลกแผนที่กระดาษบันทึกตำแหน่งทางภูมิศาสตร์และแทนสิ่งต่างๆ บนโลกที่เป็นลายเส้นและพื้นที่ด้วยสัญลักษณ์แบบ จุด เส้น พื้นที่และตัวอักษร ในระบบสารสนเทศภูมิศาสตร์จะใช้ feature ประเภทต่างๆ ในการแทนปรากฏการณ์โดยแบ่งออกเป็น 3 กลุ่ม ดังนี้

  • จุด (point)

  • เส้น (arc)

  • พื้นที่ (polygon)


เปรียบเทียบ GIS กับ MIS

     GIS เป็นระบบข้อมูลข่าวสารที่เก็บไว้ในคอมพิวเตอร์ แต่สามารถแปลความหมายเชื่อมโยงกับสภาพภูมิศาสตร์อื่นๆ สภาพท้องที่ สภาพการทำงานของ ระบบสัมพันธ์กับสัดส่วนระยะทางและพื้นที่จริงบนแผนที่ ข้อแตกต่างระหว่าง GIS กับ MIS นั้นสามารถพิจารณาได้จากลักษณะของข้อมูล คือ ข้อมูลที่จัดเก็บใน GIS มีลักษณะเป็นข้อมูลเชิงพื้นที่ ที่แสดงในรูปของภาพ (graphic) แผนที่ (map) ที่เชื่อมโยงกับข้อมูลเชิงบรรยาย หรือฐานข้อมูล การเชื่อมโยงข้อมูลทั้งสองประเภทเข้าด้วยกัน จะทำให้ผู้ใช้สามารถที่จะแสดงข้อมูลทั้งสองประเภทได้พร้อมๆ กัน เช่นสามารถจะค้นหาตำแหน่งของ จุดตรวจวัดควันดำ – ควันขาวได้โดยการระบุชื่อจุดตรวจ หรือในทางตรงกันข้าม สามารถที่จะสอบถามรายละเอียดของ จุดตรวจจากตำแหน่งที่เลือกขึ้นมา ซึ่งจะ ต่างจาก MIS ที่แสดง ภาพเพียงอย่างเดียว โดยจะขาดการเชื่อมโยงกับฐานข้อมูลที่เชื่อมโยงกับรูปภาพนั้น เช่นใน CAD (computer-aided design) จะเป็นภาพ เพียงอย่างเดียวแต่ แผนที่ใน GIS จะมีความสัมพันธ์กับตำแหน่งในเชิงพื้นที่ทางภูมิศาสตร์ คือค่าพิกัดที่แน่นอน

Phishing คืออะไร

     ฟิชชิง (phishing) คือการหลอกลวงทางอินเทอร์เน็ต เพื่อขอข้อมูลที่สำคัญเช่น รหัสผ่าน หรือหมายเลขบัตรเครดิต โดยการส่งข้อความผ่านทางอีเมลหรือเมสเซนเจอร์ ตัวอย่างของการฟิชชิง เช่น การบอกแก่ผู้รับปลายทางว่าเป็นธนาคารหรือบริษัทที่น่าเชื่อถือ และแจ้งว่ามีสาเหตุทำให้คุณต้องเข้าสู่ระบบและใส่ข้อมูลที่สำคัญใหม่ โดยเว็บไซต์ที่ลิงก์ไปนั้น มักจะมีหน้าตาคล้ายคลึงกับเว็บที่กล่าวถึง

     ฟิชชิงมาจากคำว่า ฟิชชิง (fishing) ที่แปลว่าการตกปลา ซึ่งมีความหมายถึง การปล่อยให้ปลามากินเหยื่อที่ล่อไว้

Spam คืออะไร

     สแปม (spam) คือชื่อเรียกของการส่งข้อความที่ผู้รับไม่ได้ร้องขอ ผ่านทางระบบอิเล็กทรอนิกส์ โดยส่วนมากจะทำให้เกิดความไม่พอใจต่อผู้รับข้อความ สแปมที่พบเห็นได้บ่อยได้แก่ การส่งสแปมผ่านทางอีเมล ในการโฆษณาชวนเชื่อ หรือโฆษณาขายของ โดยการส่ง อีเมลประเภทหนึ่งที่เราไม่ต้องการ ซึ่งจะมาจากทั่วโลก โดยที่เราไม่รู้เลยว่า ผู้ที่ส่งมาให้นั้นเป็นใคร จุดประสงค์คือ ผู้ส่งส่วนใหญ่ต้องการที่จะโฆษณา สินค้าหรือบริการต่าง ๆ ของบริษัทของตนเอง ซึ่งเป็นประเภทหนึ่งของเมลขยะซึ่งนอกจากจะทำให้ผู้รับรำคาญใจและเสียเวลาในการกำจัดข้อความเหล่านี้แล้ว สแปมยังทำให้ประสิทธิภาพการขนส่งข้อมูลบนอินเทอร์เน็ตลดลงด้วย สแปมในรูปแบบอื่นนอกจาก อีเมลสแปม ได้แก่ เมสเซนเจอร์สแปม นิวส์กรุ๊ปสแปม บล็อกสแปม และเอสเอ็มเอสสแปม

     การส่งสแปมเริ่มแพร่หลายเนื่องจากค่าใช้จ่ายในการส่งข้อความผ่านทางระบบอิเล็กทรอนิกส์ มีค่าใช้จ่ายน้อยมากเมื่อเทียบการการส่งข้อความชักชวนทางอื่น เช่นทางจดหมาย หรือการโฆษณาทางสื่อต่างๆ ทำให้ผู้ส่งประหยัดค่าใช้จ่ายในการส่งข้อความเชิญชวน และในขณะเดียวกันกฎหมายเกี่ยวกับระบบอิเล็กทรอนิกส์ที่เกี่ยวข้องกับสแปมยังไม่ครอบคลุม จนกระทั่งเริ่มมีใช้ครั้งแรกปี พ.ศ. 2546 (ค.ศ. 2003) ในประเทศสหรัฐอเมริกา

     คำว่าสแปมมีที่มาจากรายการโทรทัศน์ชื่อ มอนตี ไพทอน (Monty Python) ในชื่อตอนว่า สแปม ซึ่งเป็นชื่ออาหารกระป๋อง (เนื้อกระป๋อง) โดยตัวเอกของเรื่องสองคนทานอาหารเช้าที่ร้านอาหารแห่งหนึ่ง โดยตัวเอกผู้หญิงไม่ต้องการอาหารที่มีสแปมเป็นส่วนผสม แต่พนักงานเสิร์ฟพยายามชักชวนให้ตัวเอกของเรื่องกินสแปม

16 January 2008

NP-Complete คืออะไร

ในทางทฤษฎีความซับซ้อนในการคำนวณ เอ็นพีบริบูรณ์ (NP-complete) เป็นกลุ่มความซับซ้อนที่ยากที่สุดในเอ็นพี ในแง่ที่ว่าเป็นกลุ่มปัญหาที่ไม่น่าจะมีอัลกอริทึมที่มีประสิทธิภาพได้ เพราะว่าการที่มีอัลกอริทึมที่มีประสิทธิภาพสำหรับปัญหาใดปัญหาหนึ่งในเอ็นพีบริบูรณ์ ส่งผลให้เราสามารถแก้ปัญหาทั้งหมดในกลุ่มเอ็นพีได้อย่างมีประสิทธิภาพ กลุ่มความซับซ้อนเอ็นพีบริบูรณ์ในบางครั้งถูกเรียกสั้น ๆ ว่า NP-C

นิยาม



เราจะเรียกปัญหาการตัดสินใจ C ว่าเป็น เอ็นพีบริบูรณ์ เมื่อ

  1. C เป็นปัญหาเอ็นพี

  2. C เป็นปัญหาเอ็นพีแบบยาก (นั่นก็คือทุกปัญหาในเอ็นพีสามารถลดรูปเป็น C ได้)


วิธีการสู้กับเอ็นพีบริบูรณ์ -- ยอมตอบผิดเป็นบางครั้ง

ในกรณีที่เราต้องการแก้ปัญหาแบบหาคำตอบดีที่สุด ของปัญหาที่เป็นเอ็นพีบริบูรณ์ เช่น ต้องการหากลุ่มพรรคพวกที่ใหญ่ที่สุดในกราฟ ๆ หนึ่ง เรามีความหวังเพียงน้อยนิดที่จะหาคำตอบแบบดีที่สุดได้ทุกครั้งด้วยอัลกอริทึมที่มีประสิทธิภาพ (อาจจะหาได้สำหรับตัวอย่างที่มีขนาดเล็ก) โดยทั่วไปแล้วเราจะยอมตอบผิดบ้าง ซึ่งวิธีที่อาจจะนำมาใช้มีดังต่อไปนี้

  • ใช้การประมาณ เพื่อหาคำตอบที่พิสูจน์ได้ว่าไม่แย่เกินไปนัก

  • ใช้อัลกอริทึมที่มีประสิทธิภาพสำหรับบางรูปแบบการกระจายตัวของอินพุต

  • จงใจตอบเฉพาะกรณีพิเศษ

  • ใช้ฮิวริสติก ซึ่งจะทำให้อัลกอริทึมทำงานได้ดีในหลาย ๆ กรณี แต่ไม่สามารถพิสูจน์อะไรได้เลย ในบางทีอาจจะได้คำตอบที่แย่เกินกว่าจะรับได้

27 December 2007

BitTorrent


     บิตทอร์เรนต์ (BitTorrent) เป็นโปรโตคอลรูปแบบ peer-to-peer ในการแลกเปลี่ยนข้อมูลระหว่างเครื่องคอมพิวเตอร์ด้วยกันโดยตรง ผ่านเครือข่ายอินเทอร์เน็ต โดยมีต้นกำเนิดมาจากความคิดของนายแบรม โคเฮน (Bram Cohen) ที่ต้องการให้การส่งผ่านข้อมูลสามารถอำนวยประโยชน์ได้ทั้งขาเข้าและขาออก ซึ่งเขาเริ่มพัฒนามันขึ้นมาตั้งแต่เดือน เมษายน ค.ศ. 2001

หลักการทำงานของโปรแกรมบิตทอร์เรนต์



     เครือข่ายของการใช้โปรแกรมบิตทอร์เรนต์นั้นเป็นลักษณะโยงใยถึงกันหมด ทุกเครื่องคอมพิวเตอร์สามารถรับส่งไฟล์ถึงกันได้ตลอดเวลา ซึ่งทุกเครื่องจะเป็นทั้งผู้รับและผู้ให้

     เมื่อไฟล์เริ่มต้นเผยแพร่มาจากคอมพิวเตอร์เครื่องหนึ่ง เครื่องอื่น ๆ ที่ต้องการไฟล์ (หรือผู้ที่รอโหลดอยู่นั่นเอง) ก็จะค่อยๆ ได้รับชิ้นส่วนไฟล์ไปทีละชิ้นทีละชิ้นแบบสุ่ม เหมือนภาพต่อจิ๊กซอว์

     ทันทีที่ได้รับชิ้นส่วนไฟล์มา คอมพิวเตอร์เครื่องนั้นก็สามารถส่งต่อชิ้นส่วนไฟล์ที่ได้รับมาแล้วให้เครื่องอื่นที่ยังไม่มีได้ทันที ไม่ต้องรอให้ตัวเองได้ชิ้นส่วนไฟล์จนครบ 100% เสียก่อน เป็นลักษณะของการเติมเต็มให้กัน ชิ้นส่วนไฟล์ตรงใหนที่ขาดไป สุดท้ายแล้วก็จะได้รับมาจากคอมพิวเตอร์เครื่องใดเครื่องหนึ่งในเครือข่ายในที่สุด ด้วยสาเหตุนี้เอง โปรแกรมบิตทอร์เรนต์จึงสามารถทำให้การส่งผ่านข้อมูลสามารถอำนวยประโยชน์ได้ทั้งขาเข้าและขาออก

การใช้งาน

     ก่อนการใช้งานต้องมีโปรแกรมที่เรียกว่า ทอร์เร็นต์ไคลเอนต์ ก่อน หลังจากนั่นจึงจะสามารถไป ดาวน์โหลด ไฟล์จากเว็บไซต์ บิตทอร์เรนต์ ต่างๆได้ โดยในปัจจุบัน เว็บไซต์ บิตทอร์เรนต์ มี 2 ประเภทคือ บิตทอร์เรนต์เปิด และ บิตทอร์เรนต์ปิด

- บิตทอร์เรนต์เปิด - คือเว็บไซต์ บิตทอร์เรนต์ ที่บุคคลทั่วไปทั่วไปหรือสมาชิกที่ผ่านเข้าไปสามารถดาวน์โหลดไฟล์ได้ โดยไม่มีเงื่อนไขและไม่จำเป็นต้องเป็นสมาชิกที่เว็บไซต์นั้นๆ
- บิตทอร์เรนต์ปิด - คือเว็บไซต์ บิตทอร์เรนต์ ที่บุคคลทั่วไปไม่สามารถเข้าไปดาวน์โหลดไฟล์ได้ โดยจะต้องเป็นสมาชิกก่อนเท่านั้น และจะไม่สามารถดาวน์โหลดไฟล์ได้ ถ้าสมาชิกยังไม่ได้ออัปโหลด โดยจะมีการคำนวณ ปริมาณการอัปโหลดต่อดาวน์โหลดเป็น Ratio โดยแต่ละเว็บไซต์จะกำหนด Ratio ขั้นต่ำในการดาวน์โหลดไฟล์แตกต่างกัน