Điểm:0

Định kỳ cần chạy fsck vì hệ thống không khởi động được

lá cờ cn

Thỉnh thoảng, hệ thống Linux của tôi không khởi động được và báo lỗi hệ thống tệp. Tôi có thể "sửa" chúng bằng cách khởi động bằng LiveCD và chạy:

sudo fsck -y /dev/sda1

Lệnh cho biết nó tìm thấy các khối xấu và sửa chúng, sau đó hệ thống sẽ khởi động lại. Thực tế là chúng tiếp tục xảy ra cho thấy lỗi phần cứng hay có thể có điều gì khác không ổn?

Tôi lưu ý rằng khi tôi thay vì chạy:

sudo fsck -y /dev/sda

Tôi nhận được những lỗi này:

fsck từ util-linux 2.34 [/usr/sbin/fsck.ext2 (1) -- /dev/sda] fsck.ext2 /dev/sda e2fsck 1.45.5 (07-Jan-2020) ext2fs_open2: Số ma thuật xấu trong super -block fsck.ext2: Siêu khối không hợp lệ, đang thử các khối sao lưu... fsck.ext2: Số ma thuật sai trong siêu khối khi cố mở /dev/sda

Không thể đọc siêu khối hoặc không mô tả hệ thống tệp ext2/ext3/ext4 hợp lệ. Nếu thiết bị hợp lệ và nó thực sự chứa hệ thống tệp ext2/ext3/ext4 (chứ không phải hoán đổi hoặc ufs hay thứ gì khác), thì siêu khối bị hỏng và bạn có thể thử chạy e2fsck với một siêu khối thay thế:
    e2fsck -b 8193 <thiết bị> hoặc
    e2fsck -b 32768 <thiết bị>

Đã tìm thấy bảng phân vùng dos trong/dev/sda

Đây có phải là do nó không hợp lệ để chạy fsck trên toàn bộ đĩa thay vì chỉ một phân vùng hay có thứ gì đó bị hỏng trên ổ đĩa của tôi? Tôi đã thấy nhiều nơi trên internet hướng dẫn chạy fsck trên toàn bộ đĩa. Đĩa của tôi chỉ có một phân vùng, một Linux ext4.

Đây là hình ảnh của cửa sổ Kiểm tra & Dữ liệu thông minh của ứng dụng Disks. nhập mô tả hình ảnh ở đây

Kết quả của grep -i FPDMA /var/log/syslog* là:

adam>grep -i FPDMA /var/log/syslog*
/var/log/syslog:Sep 21 13:40:19 adam-gregs-better-computer kernel: [ 728.921941] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:40:19 adam-gregs-better-computer kernel: [ 729.213899] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:40:20 adam-gregs-better-computer kernel: [ 729.373884] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:42:40 adam-gregs-better-computer kernel: [ 870.000879] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:42:40 adam-gregs-better-computer kernel: [ 870.000904] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:05 adam-gregs-better-computer kernel: [ 895.312734] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:05 adam-gregs-better-computer kernel: [ 895.312760] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:06 adam-gregs-better-computer kernel: [ 895.476760] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:06 adam-gregs-better-computer kernel: [ 895.640724] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:49 adam-gregs-better-computer kernel: [ 938.924872] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:49 adam-gregs-better-computer kernel: [ 938.924901] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:49 adam-gregs-better-computer kernel: [ 938.924924] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:49 adam-gregs-better-computer kernel: [ 938.924945] ata3.00: lỗi lệnh: WRITE FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:53 adam-gregs-better-computer kernel: [ 942.878558] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:43:53 adam-gregs-better-computer kernel: [ 942.878583] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog.1:Sep 18 08:30:43 adam-gregs-better-computer kernel: [ 33.579255] ata3.00: lỗi lệnh: READ FPDMA QUEUED
lá cờ ru
Tôi đề xuất rằng với hệ thống của bạn liên tục cần chạy kiểm tra hệ thống tệp, ổ đĩa của bạn có thể bị lỗi, đặc biệt là khi bạn nhận được thông báo khối xấu ở mỗi `fsck`. Tôi sẽ bắt đầu sao lưu dữ liệu của bạn vào một ổ đĩa khác và sớm chuẩn bị cài đặt lại vào một ổ đĩa mới, vì ổ đĩa sắp chết là một cách nhanh chóng để làm mất dữ liệu quan trọng của bạn.
heynnema avatar
lá cờ ru
Chỉnh sửa câu hỏi của bạn và cho tôi xem ảnh chụp màn hình của cửa sổ dữ liệu ứng dụng `Disks` **Dữ liệu THÔNG MINH & Kiểm tra**. Thay đổi kích thước cửa sổ để thu thập tất cả dữ liệu cho ảnh chụp màn hình. Bắt đầu nhận xét cho tôi bằng @heynnema nếu không tôi sẽ nhớ chúng.
lá cờ cn
@heynnema Tôi đã cập nhật câu hỏi bằng ảnh chụp màn hình.
heynnema avatar
lá cờ ru
Đây là SSD hay HDD? Nó bao nhiêu tuổi?
heynnema avatar
lá cờ ru
Chỉnh sửa câu hỏi của bạn và cho tôi xem `grep -i FPDMA /var/log/syslog*`.
lá cờ cn
@heynnema Đã xong.
lá cờ cn
@heynnema Đó là ổ SSD. Tôi không chắc chính xác nó bao nhiêu tuổi - tôi đã mượn nó khoảng 2 năm trước từ một người có máy tính tốt hơn. Đó là 240GB.
Điểm:3
lá cờ uz
Jos

Để trả lời câu hỏi cuối cùng của bạn đầu tiên, một fsck là kiểm tra hệ thống tệp, không phải kiểm tra đĩa.Tất nhiên, bạn có thể kiểm tra toàn bộ đĩa của mình, nhưng fsck sẽ kiểm tra và có thể sửa chữa từng hệ thống tệp riêng biệt, có thể song song.

Gặp phải các khối xấu ở mỗi lần chạy fsck không chỉ ra một lỗi phần cứng. Nội dung của một khối xấu được sao chép sang một khối tốt có sẵn và sau đó khối đó được đánh dấu là "xấu", nghĩa là phần mềm hệ thống tệp sẽ không sử dụng nó nữa. Vì vậy, số lượng khối xấu trên đĩa của bạn dường như tăng lên. Bạn có thể muốn xác minh rằng bạn có bản sao lưu phù hợp.

heynnema avatar
lá cờ ru
OP có ổ SSD. SSD có thể cần cập nhật chương trình cơ sở hoặc chỉnh sửa GRUB. Vui lòng xem "lỗi NCQ" trong câu trả lời của tôi.
Điểm:1
lá cờ ru

fsck

Hãy sửa chữa hệ thống tập tin của bạn (một lần nữa)...

  • khởi động vào Ubuntu Live DVD/USB ở chế độ Dùng thử Ubuntuâ
  • mở một phần cuối cửa sổ bằng cách nhấn Điều khiển+thay thế+t
  • loại Sudo fdisk -l
  • xác định tên thiết bị /dev/sdXX cho "Hệ thống tệp Linux" của bạn
  • loại sudo fsck -f /dev/sda1, thay thế sdXX với số bạn đã tìm thấy trước đó
  • lặp lại fsck lệnh nếu có lỗi
  • loại khởi động lại

Khối xấu và dữ liệu SMART

Các Dữ liệu THÔNG MINH cho biết những gì thường sẽ là một ổ cứng bị lỗi. Tuy nhiên, chúng tôi có một ổ SSD không quá cũ. Trước tiên, chúng tôi sẽ xem xét giải quyết các lỗi NCQ.

Ghi chú: Xác định nhà sản xuất và kiểu # của SSD, sau đó truy cập trang web của họ để kiểm tra chương trình cơ sở đã cập nhật.

Ghi chú: Duy trì các bản sao lưu tốt, đề phòng SSD bị lỗi.

lỗi NCQ

grep -i FPDMA /var/log/syslog*

/var/log/syslog:Sep 21 13:40:19 adam-gregs-better-computer kernel: [ 728.921941] ata3.00: lỗi lệnh: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:40:19 adam-gregs-better-computer kernel: [ 729.213899] ata3.00: lỗi lệnh: READ FPDMA QUEUED

Hàng đợi lệnh gốc (NCQ) là một phần mở rộng của giao thức Serial ATA cho phép các ổ đĩa cứng tối ưu hóa bên trong thứ tự thực thi các lệnh đọc và ghi nhận được.

Chỉnh sửa sudo -H gedit /etc/default/grub và thay đổi dòng sau để bao gồm tham số bổ sung này. Sau đó làm cập nhật sudo-grub để ghi các thay đổi vào đĩa. Khởi động lại. Màn hình bị treo/v.v., và xem grep -i FPDMA /var/log/syslog* hoặc dmesg cho các thông báo lỗi tiếp tục.

GRUB_CMDLINE_LINUX_DEFAULT="giật gân libata.force=noncq"
lá cờ cn
Ổ đĩa là ADATA SU635. Tôi không thể tìm thấy bản cập nhật chương trình cơ sở trên trang web của họ. Ngoài ra, trang Amazon cho biết nó có mặt lần đầu tiên vào tháng 1 năm 2020, vì vậy có lẽ nó thực sự mới hơn tôi nghĩ (chắc tôi đã bắt đầu sử dụng nó vào khoảng năm 2020). Trong quá trình mở máy tính để kiểm tra kiểu máy, tôi cũng phát hiện ra rằng nó bị nghiêng do thiếu một số ốc vít giữ nó trong vỏ, chắc chắn nó sẽ di chuyển khi tôi nghiêng máy tính vào một lúc nào đó. Tôi tự hỏi nếu điều đó đã gây ra vấn đề? Tôi đã cắm nó vào và chúng ta sẽ xem liệu sự cố có tiếp tục xảy ra hay không.
heynnema avatar
lá cờ ru
@ user2596667 Hãy tiếp tục và thực hiện câu trả lời của tôi để thử và giải quyết vấn đề.
lá cờ cn
Tôi muốn chờ xem liệu việc vặn vào ổ đĩa có sửa được gì không. Cho đến nay không có lỗi NCQ nào xuất hiện kể từ đó. Nếu một số làm được hoặc nếu nó lại thất bại thì tôi sẽ thử các bước được đề xuất của bạn.
lá cờ cn
Bạn cũng có thể giải thích lý do tại sao cần sửa chữa lại hệ thống tệp bằng fsck không, vì tôi mới chạy nó và sửa lỗi? Có phải vì tùy chọn -f là quan trọng hay vì cần phải tiếp tục chạy lại cho đến khi không có lỗi? Ngoài ra, điều gì cụ thể trong ảnh chụp màn hình của tôi chỉ ra một ổ đĩa bị lỗi và điều gì khác biệt về ổ SSD khiến nó có khả năng sửa chữa được ở những nơi không có ổ đĩa cơ?
heynnema avatar
lá cờ ru
@ user2596667 Bạn cần chạy lại `fsck` vì đó là cách khắc phục chính và vì nó đang tìm lỗi. -f chỉ buộc kiểm tra xảy ra, ngay cả khi ổ đĩa báo cáo rằng nó sạch. Nếu bạn xem Dữ liệu SMART, Số lượng khu vực đã di chuyển và Các lỗi không thể sửa được đã báo cáo cũng như Số lần di chuyển và Tỷ lệ lỗi UDMA CRC và Tỷ lệ thử lại lỗi đọc đều là các giá trị khác không. Lỗi SSD là lỗi điện tử, lỗi ổ cứng thường là lỗi phương tiện vật lý.
lá cờ cn
Được rồi cảm ơn. Tôi vẫn không chắc mình hoàn toàn hiểu tại sao SSD có một số lỗi nhưng tôi đã tìm thấy [điều này](https://www.crucial.com/support/articles-faq-ssd/my-ssd-has- bad-sectors) nói rằng điểm quan trọng không phải là liệu có các thành phần xấu hay không, mà là liệu chúng có tăng lên theo thời gian hay không. Vì vậy, tôi sẽ theo dõi xem có bất kỳ thành phần xấu mới nào xuất hiện hay không khi tôi đã bảo mật ổ đĩa về mặt vật lý và chạy fsck -f.
lá cờ cn
Tôi đã gặp một lỗi NCQ mới và đã kiểm tra lại ứng dụng Đĩa và nhận thấy thêm một số thành phần xấu (nhưng không có sự cố hoặc sự cố nào, vì vậy tôi sẽ không nhận thấy điều đó nếu không theo dõi, cảm ơn!). Vì vậy, bây giờ tôi đã triển khai đề xuất của bạn về việc bật libata.force=noncq. Chúng tôi sẽ xem liệu có bất kỳ thành phần xấu nào xuất hiện nữa khi tùy chọn này được bật hay không. Tôi đã chạy lại fsck và nó không tìm thấy lỗi mới. Các thành phần xấu lên đến năm 1880 bây giờ.
lá cờ cn
Tôi lại gặp một lỗi khởi động khác và nhiều thành phần xấu hơn (đến năm 1952 bây giờ). Tôi cũng nhận được một thông báo lạ khi cố khởi động: `mount: mount /run on /root/run fail: Bad message` `[!!!!!!] Không thể gắn hệ thống tệp API.` Tôi đã chạy lại fsck để có thể khởi động lại, nhưng vì tôi có libata.force=noncq mà vẫn gặp sự cố, tôi phải kết luận rằng thực tế đó là một ổ đĩa bị lỗi.
heynnema avatar
lá cờ ru
@ user2596667 Yup, có vẻ như ổ đĩa bị hỏng... trừ khi đây là máy tính để bàn, và khi đó nguồn điện cũng có thể bị nghi ngờ.
lá cờ cn
Nó là một máy tính để bàn, nhưng nó có một ổ SSD khác có 0 thành phần xấu.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.