Điểm:1

Có cách nào để sử dụng plugin đính kèm nhập liệu với Tìm kiếm ứng dụng đàn hồi không

lá cờ bv

Tôi đang làm việc trên một cổng lưu trữ nhiều loại tài liệu (HTML, PDF, PPTx, DocX) và làm cho tất cả chúng có thể tìm kiếm được ở một nơi.

Chúng tôi có thể đạt được điều này bằng cách sử dụng "tiêu chuẩn" sẵn có của Tìm kiếm đàn hồi và plugin Tệp đính kèm nhập nhưng tôi không phải là nhà khoa học dữ liệu và biết rất ít về cách viết các truy vấn đàn hồi, vì vậy kết quả tìm kiếm của chúng tôi không tốt.

Tôi đã được khuyến nghị sử dụng Tìm kiếm ứng dụng dành cho doanh nghiệp thay vì thử điều chỉnh các truy vấn cơ bản của mình, nhưng có vẻ như tôi không thể sử dụng plugin đính kèm nhập liệu với nó? Do đó, tôi không thể tận dụng việc chỉ gửi nội dung được mã hóa base64 tới API tài liệu và mong muốn nội dung được lập chỉ mục.

Có cách nào để khắc phục điều này? Hay tôi không thể sử dụng Tìm kiếm ứng dụng cho việc này??

Điểm:0
lá cờ bv

Câu trả lời cho điều này là trích xuất nội dung tệp đính kèm bằng cách tận dụng đường dẫn tệp đính kèm như được đề xuất trong bài đăng trên blog này hoặc, nếu bạn có chương trình phụ trợ bằng Java như tôi, bạn có thể sử dụng Apache Tika để tự trích xuất nội dung của bạn từ tệp đính kèm.

Tôi đã triển khai Tika để trích xuất nội dung HTML (thực ra nó rất đơn giản)

chuỗi tĩnh getContent(String htmlContent) ném TikaException, SAXException, IOException {
    Đầu vào InputStream = new ByteArrayInputStream(htmlContent.getBytes());
    Trình xử lý ContentHandler = BodyContentHandler mới();
    Siêu dữ liệu siêu dữ liệu = siêu dữ liệu mới();
    HtmlParser mới().parse(đầu vào, trình xử lý, siêu dữ liệu, ParseContext() mới);
    trả về handler.toString();
}

Đối với các tệp PDF, tôi đã sử dụng Apache PdfBox để trích xuất một số thuộc tính khác để văn bản trở nên "miễn phí".Tương tự đối với các tệp Office, nhưng điều đó yêu cầu Apache Poi.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.