ลูซีน
จากวิกิพีเดีย สารานุกรมเสรี
ลูซีน Lucene |
|
---|---|
![]() |
|
ผู้พัฒนา | มูลนิธิซอฟต์แวร์อาแพชี |
รุ่นเสถียร ล่าสุด |
2.1.0 (17 กุมภาพันธ์ 2550) |
รุ่นทดลอง ล่าสุด |
() |
โอเอส | ข้ามแพลตฟอร์ม |
ชนิด | การค้นหาข้อมูล and การสร้างดัชนี ส่วนต่อประสานโปรแกรมประยุกต์. |
ลิขสิทธิ์ | สัญญาอนุญาตซอฟต์แวร์อาแพชี |
เว็บไซต์ | lucene.apache.org |
ลูซีน (Lucene) เป็นซอฟต์แวร์เสรีและซอฟต์แวร์โอเพนซอร์สสำหรับใช้เป็นส่วนต่อประสานโปรแกรมประยุกต์ในการค้นคืนสารสนเทศ แต่เดิมลูซีนถูกเขียนขึ้นโดยใช้ภาษาจาวา โดย Doug Cutting ซึ่งสนับสนุนโดยมูลนิธิซอฟต์แวร์อาแพชี และเผยแพร่โดยใช้สัญญาอนุญาตซอฟต์แวร์อาแพชี ลูซีนถูกย้ายไปเขียนขึ้นด้วยภาษาอื่นๆนอกจากภาษาจาวาด้วย ได้แก่ ภาษาเพิร์ล ภาษาซีชาร์ป ภาษาซีพลัสพลัส ภาษาไพทอน ภาษารูบี้ และภาษาพีเอชพี
ลูซีนเหมาะกับการใช้งานใดที่ต้องการการสร้างดัชนีข้อความอย่่างเต็มรูปแบบ (Full-text indexing) และความสามารถในการค้นคืนข้อความแบบเต็มรูปแบบ (Full-text searching) ลูซีนได้รับการยอมรับอย่างกว้างขวางในการนำไปใช้สร้างเครื่องมือช่วยค้นหาข้อมูลสำหรับอินเทอร์เน็ต หรือ ภายในองค์กร หรือ เฉพาะในเว็บไซต์เดียว ซึ่งบางครั้งก็มีผู้เข้าใจผิดว่าลูซีนเป็นเครื่องมือช่วยค้นหาข้อมูลเต็มรูปแบบ ที่มีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML ด้วย ทั้งนี้โปรแกรมที่ใช้งานลูซีนจะต้องมีมีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML โดยแยกออกจากลูซีน
สิ่งที่อยู่ในแก่นของสถาปัตยกรรมเชิงตรรกะของลูซีนคือแนวคิดว่าเอกสารประกอบไปด้วยเขตข้อมูลของข้อความ ซึ่งทำให้ส่วนต่อประสานโปรแกรมประยุกต์ของลูซีนยืดหยุ่นพอที่จะไม่ขึ้นอยู่กับรูปแบบไฟล์ ข้อความจากไฟล์ในรูปแบบ PDF HTML เอกสารไมโครซอฟต์เวิร์ด และรูปแบบอื่นๆอีกมากมายสามารถนำมาสร้างดัชนีได้ตราบเท่าที่สามารถสกัดข้อความจากเอกสารได้
[แก้] โครงการที่ใช้ลูซีน
- วิกิพีเดียใช้ลูซีนในการค้นหาแบบเต็มรูปแบบ
- บีเกิลใช้ลูซีนที่ย้ายไปเขียนด้วยภาษาซีชาร์ป ชื่อว่า Lucene.Net สำหรับสร้างดัชนี
- Docco (โฮมเพจ) ใช้ลูซีนในการค้นหาในเครื่องส่วนบุคคล (Desktop search)
- DSpace (โฮมเพจ) ใช้ลูซีน