Điểm:-1

Tại sao Hadoop và Spark không có trong kho chính thức của Ubuntu?

lá cờ cn

CẬP NHẬT (2021-11-13 22:12 GMT+8): liên quan đến các gói Snap, @karel gợi ý rằng câu hỏi này trùng lặp với Tại sao kho Ubuntu không có các phiên bản phần mềm mới nhất? Tôi không đồng ý, bởi vì (1) Snaps, tự giới hạn và đi kèm với tất cả các phụ thuộc của nó, khác với các gói gỡ lỗi và tôi mong đợi cái trước sẽ theo sát hướng ngược dòng hơn và (2) ngay cả khi không, tôi mong đợi chúng đến nay đã ổn định.


Tôi thấy điều này đã được hỏi trong Hadoop & Spark - tại sao không có gói Ubuntu? , nhưng (1) đó là vào năm 2015 và bối cảnh máy tính đã thay đổi rất nhiều kể từ đó và (2) câu trả lời duy nhất cho câu hỏi khác đó không thực sự trả lời câu hỏi đó, vì vậy tôi nghĩ rằng nên hỏi lại.

Vì vậy, bây giờ vào năm 2021, điện toán đám mây và dữ liệu lớn chỉ trở nên phổ biến hơn so với năm 2015. Xét rằng một trong những trường hợp sử dụng chính của Linux là trong điện toán đám mây/dữ liệu lớn, tại sao cách thiết lập Hadoop và Spark thực tế lại ( khung chính liên quan đến xử lý dữ liệu lớn) vẫn tải xuống và giải nén các kho lưu trữ từ thượng nguồn, thay vì chỉ tìm nạp các gói nhị phân thích hợp từ kho lưu trữ chính thức của Ubuntu bằng cách chạy một chương trình thích hợp. cài đặt apt chỉ huy? Trừ khi tôi thiếu thứ gì đó, tôi tưởng tượng rằng việc đóng gói sẵn các khung thường được sử dụng như vậy cho Ubuntu sẽ mang lại một số lợi ích hữu hình cho cơ sở người dùng rộng lớn, chẳng hạn như (nhưng không giới hạn ở):

  • Cải thiện tích hợp với hệ thống máy chủ
  • Yêu cầu thiết lập và cấu hình thủ công ít hơn

Tái bút Tôi cũng đã kiểm tra cửa hàng Snap khi xem xét sự thúc đẩy của Canonical đối với snaps trong những năm gần đây và trong khi chúng dường như được đóng gói (Hadoop, tia lửa), những nỗ lực cuối cùng đã trở lại vào năm 2017 và chúng chỉ khả dụng trong các kênh beta / cạnh không ổn định.

karel avatar
lá cờ sa
Điều này có trả lời câu hỏi của bạn không? [Tại sao kho Ubuntu không có phiên bản phần mềm mới nhất?](https://askubuntu.com/questions/151283/why-dont-the-ubuntu-repositories-have-the-latest-versions-of-software )
Donald Sebastian Leung avatar
lá cờ cn
Không, bởi vì Hadoop và Spark dường như không có trong kho chính thức của Ubuntu _at all_ (Tôi không thể tìm thấy bất kỳ thứ gì có liên quan với `apt-cache search`)
karel avatar
lá cờ sa
Các gói hadoop và spark snap cũng chưa được cập nhật kể từ năm 2017. Đó là điều khiến câu hỏi này trở thành câu hỏi trùng lặp hoặc dựa trên ý kiến.
Donald Sebastian Leung avatar
lá cờ cn
Nhưng sau đó (1) Tôi hy vọng các gói Snap sẽ theo dõi sát sao hơn và (2) ngay cả khi không, hiện tại nó đã ổn định
karel avatar
lá cờ sa
Tôi cũng mong đợi điều tương tự vì cả hai gói snap đều được duy trì bởi cùng một người, nhưng điều đó đã không xảy ra.
Điểm:2
lá cờ cn

Cả Hadoop và Spark đều bị loại bỏ khỏi Debian nhiều năm trước, chủ yếu là do thiếu sự quan tâm tình nguyện trong việc duy trì các gói đó. Ubuntu nhận được hầu hết các gói gỡ lỗi của nó từ Debian, vì vậy chúng cũng bị loại bỏ khỏi Ubuntu.

Bất kỳ tình nguyện viên cộng đồng nào sẵn sàng tìm hiểu quy trình và đóng góp nỗ lực có thể giới thiệu lại các gói cho Debian, và sau đó chúng sẽ chuyển sang các bản phát hành Ubuntu trong tương lai. Nhiều tình nguyện viên hơn = Phần mềm nhiều hơn, tốt hơn và cập nhật hơn.

Ngoài ra, theo https://wiki.debian.org/Hadoop, các nhà phát triển Hadoop đã không làm cho việc đóng gói deb và bảo trì trở nên dễ dàng đối với các tình nguyện viên Debian:

Có một số lý do cho việc này; cụ thể là quy trình xây dựng Hadoop sẽ tải các phụ thuộc khác nhau thông qua Maven thay vì sử dụng các gói do phân phối cung cấp. Rất tiếc, các dự án Java như thế này không dễ đóng gói vì tính phụ thuộc lẫn nhau; và thật không may, ngăn xếp Hadoop chứa đầy các phụ thuộc kỳ lạ

Nếu thông tin này cũ hoặc không chính xác, một lần nữa, các tình nguyện viên trong cộng đồng sẽ đứng lên, chỉnh sửa và thực hiện các thay đổi. Debian và Ubuntu được thúc đẩy bởi các tình nguyện viên. Nhiều tình nguyện viên hơn = Tài liệu tốt hơn.

Donald Sebastian Leung avatar
lá cờ cn
Cảm ơn bạn, đây là lời giải thích chi tiết tôi đang tìm kiếm. Thật tiếc là các nhà phát triển Hadoop đã không làm cho việc đóng gói dễ dàng cho các bản phân phối như Debian (và Ubuntu). Có lẽ tôi nên xem xét đóng góp đôi khi :-)

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.