Помогите понять ошибки SSD

Изображение пользователя Sakura-chan.

Возникла непонятная проблема с SSD. На нём вообще стояла Win8.1 и было место под Kubuntu.
К сожалению, Kubuntu я поставить не успел. Win8 грузится долго, логинится ещё дольше, и постоянно перезагружается плитка и explorer. Но ошибок никаких не выдаёт.
Я решил не париться и поставить пока Kubuntu. Загрузился с флешки 14.10.

Установка не проходит. Адски долго длится чтение разделов дисков (минут 5-10). Для двух HDD в итоге выводит всё нормально, для SSD выдаёт список разделов, но сколько на них место - пишет, что неизвестно. Установить туда Kubuntu не может - какие-то ошибки доступа к устройству.

При этом fdisk -l выдаёт всё мгновенно.
Примечание: у меня sda - SSD под систему, sdb и sdc - обычные винты.

[email protected]:/home/kubuntu# fdisk -l /dev/sda

Диск /dev/sda: 240.1 Гб, 240057409536 байт
255 головок, 63 секторов/треков, 29185 цилиндров, всего 468862128 секторов
Units = секторы of 1 * 512 = 512 bytes
Размер сектора (логического/физического): 512 байт / 512 байт
I/O size (minimum/optimal): 512 bytes / 512 bytes
Идентификатор диска: 0x0d4ed231

Устр-во Загр     Начало       Конец       Блоки   Id  Система
/dev/sda1   *        2048      718847      358400    7  HPFS/NTFS/exFAT --> NTFS, это System Restore винды (где-то 100..200 Мб)
/dev/sda2          718848   122879999    61080576    7  HPFS/NTFS/exFAT --> NTFS, тут у меня Win8 (~60 Гб)
/dev/sda3       122880000   204799999    40960000    6  FAT16           --> (нет) место для линукса (~40 Гб)
/dev/sda4       204800000   468858879   132029440    7  HPFS/NTFS/exFAT --> NTFS, диск под виндовые игры (~140 Гб)

Далее, я установил smartmontools и попробовал посмотреть:

[email protected]:/home/kubuntu# smartctl -a /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     SandForce Driven SSDs
Device Model:     KINGSTON SV300S37A240G
Serial Number:    50026B72370618C2
LU WWN Device Id: 5 0026b7 2370618c2
Firmware Version: 505CUA
User Capacity:    240 057 409 536 bytes [240 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS, ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri May  2 08:53:54 2014 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (    0) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        (  48) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x0021) SCT Status supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   070   070   050    Pre-fail  Always       -       2736/9485517
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       8
  9 Power_On_Hours_and_Msec 0x0032   098   098   000    Old_age   Always       -       1771h+41m+54.800s
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       355
171 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       149
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       2
181 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   000   000   000    Old_age   Always       -       36807
189 Airflow_Temperature_Cel 0x0000   031   068   000    Old_age   Offline      -       31 (Min/Max 17/68)
194 Temperature_Celsius     0x0022   031   068   000    Old_age   Always       -       31 (Min/Max 17/68)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/9485517
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       8
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/9485517
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/9485517
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0000   000   000   000    Old_age   Offline      -       2859
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       1108
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       1108
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       1319

SMART Error Log not supported

SMART Self-test Log not supported

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

На мой не особо профессиональный взгляд - вроде всё более-менее нормально. Почему 8 переназначеных секторов тока - непонятно. Но я что-то слышал, что у SSD бывают некие фабричные браки, которые изначально переназначены. (не уверен, что это не бред)

Дальше я пошёл гуглить и попробовал ещё два эксперимента.
Первыей: сделал dd для проверки, как быстро и успешно он читается. Вроде я понял, что с этим всё ок.

[email protected]:/home/kubuntu# dd if=/dev/sda of=/dev/null bs=8k count=100k
dd: ошибка чтения «/dev/sda»: Ошибка ввода/вывода
50488+0 записей получено
50488+0 записей отправлено
скопировано 413597696 байт (414 MB), 2,06882 c, 200 MB/c

Второй эксперимент:
[email protected]:/home/kubuntu# hdparm -Tt /dev/sda

/dev/sda:
Timing cached reads:   9276 MB in  1.99 seconds = 4649.88 MB/sec
Timing buffered disk reads: read(2097152) returned 458752 bytes

Тут странное что-то во 2й строке, на других дисках он пишет там мегобайты и скорость.
И ещё, после этой команды в dmesg появляется куча ошибок, которые я не понимаю. Выглядит будто программные ошибки. Может кто-то может пояснить их суть?

[ 8803.134811] ata1.00: exception Emask 0x0 SAct 0x3 SErr 0x0 action 0x0
[ 8803.134819] ata1.00: irq_stat 0x40000008
[ 8803.134826] ata1.00: failed command: READ FPDMA QUEUED
[ 8803.134836] ata1.00: cmd 60/00:08:00:53:0c/01:00:00:00:00/40 tag 1 ncq 131072 in
[ 8803.134836]          res 51/40:80:80:53:0c/00:00:00:00:00/40 Emask 0x409 (media error) <F>
[ 8803.134841] ata1.00: status: { DRDY ERR }
[ 8803.134845] ata1.00: error: { UNC }
[ 8803.155583] ata1.00: configured for UDMA/133
[ 8803.155654] sd 0:0:0:0: [sda] Unhandled sense code
[ 8803.155663] sd 0:0:0:0: [sda] 
[ 8803.155666] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 8803.155671] sd 0:0:0:0: [sda] 
[ 8803.155675] Sense Key : Medium Error [current] [descriptor]
[ 8803.155682] Descriptor sense data with sense descriptors (in hex):
[ 8803.155685]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[ 8803.155702]         00 0c 53 80
[ 8803.155711] sd 0:0:0:0: [sda] 
[ 8803.155715] Add. Sense: Unrecovered read error - auto reallocate failed
[ 8803.155719] sd 0:0:0:0: [sda] CDB:
[ 8803.155722] Read(10): 28 00 00 0c 53 00 00 01 00 00
[ 8803.155737] end_request: I/O error, dev sda, sector 807808
[ 8803.155741] quiet_error: 23 callbacks suppressed
[ 8803.155745] Buffer I/O error on device sda, logical block 100976
[ 8803.155756] Buffer I/O error on device sda, logical block 100977
[ 8803.155760] Buffer I/O error on device sda, logical block 100978
[ 8803.155765] Buffer I/O error on device sda, logical block 100979
[ 8803.155769] Buffer I/O error on device sda, logical block 100980
[ 8803.155774] Buffer I/O error on device sda, logical block 100981
[ 8803.155778] Buffer I/O error on device sda, logical block 100982
[ 8803.155783] Buffer I/O error on device sda, logical block 100983
[ 8803.155788] Buffer I/O error on device sda, logical block 100984
[ 8803.155791] Buffer I/O error on device sda, logical block 100985
[ 8803.155806] ata1: EH complete
[ 8803.575302] ata1.00: exception Emask 0x0 SAct 0x3 SErr 0x0 action 0x0
[ 8803.575310] ata1.00: irq_stat 0x40000008
[ 8803.575316] ata1.00: failed command: READ FPDMA QUEUED
[ 8803.575326] ata1.00: cmd 60/08:08:80:53:0c/00:00:00:00:00/40 tag 1 ncq 4096 in
[ 8803.575326]          res 51/40:08:80:53:0c/00:00:01:00:00/40 Emask 0x409 (media error) <F>
[ 8803.575332] ata1.00: status: { DRDY ERR }
[ 8803.575336] ata1.00: error: { UNC }
[ 8803.596129] ata1.00: configured for UDMA/133
[ 8803.596171] sd 0:0:0:0: [sda] Unhandled sense code
[ 8803.596175] sd 0:0:0:0: [sda] 
[ 8803.596179] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 8803.596182] sd 0:0:0:0: [sda] 
[ 8803.596185] Sense Key : Medium Error [current] [descriptor]
[ 8803.596191] Descriptor sense data with sense descriptors (in hex):
[ 8803.596194]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[ 8803.596211]         01 0c 53 80
[ 8803.596219] sd 0:0:0:0: [sda] 
[ 8803.596223] Add. Sense: Unrecovered read error - auto reallocate failed
[ 8803.596227] sd 0:0:0:0: [sda] CDB:
[ 8803.596230] Read(10): 28 00 00 0c 53 80 00 00 08 00
[ 8803.596244] end_request: I/O error, dev sda, sector 807808
[ 8803.596266] ata1: EH complete

В итоге я так и не знаю - умер ли у меня SSD, или это просто умерла винда, а Kubuntu просто не хочет с ним работать почему-то.
Не знаю что делать. Буду благодарен за советы.

0
Susumo - 2 Май, 2014 - 14:01
Изображение пользователя Susumo.

/dev/sda3 122880000 204799999 40960000 6 FAT16 --> (нет) место для линукса (~40 Гб) Я правильно понимаю, вы под кореневую выделили раздел с fat16?

0
Sakura-chan - 2 Май, 2014 - 16:19
Изображение пользователя Sakura-chan.

Не, он просто не форматирован ещё.

+1
lord_i - 2 Май, 2014 - 14:10
Изображение пользователя lord_i.

98% - жопа винту, 2% - проблема в саташном кабеле (попробуйте заменить и провести такие-же тесты)

0
Sakura-chan - 2 Май, 2014 - 16:29
Изображение пользователя Sakura-chan.

Спасибо, попробую заменить. (хотя так внезапно это случилось, вечером выключил, лёг спать - утром комп помер, что сомневаюсь, что кабель).
Если всё же винт сдох, как вообще можно представить по гарантии претензию? Кроме ошибок dmesg как-то не видно (мне), что именно с ним не так. Даже проверка чтения вроде проходит успешно..

0
lord_i - 2 Май, 2014 - 16:49
Изображение пользователя lord_i.

187 Reported_Uncorrect 0x0032 000 000 000 Old_age Always - 36807
Ну и ошибки в dmesg - это весьма веские доказательства ...
Немного настораживает

174 Unexpect_Power_Loss_Ct 0x0030 000 000 000 Old_age Offline - 149

Вы что, комп как-то некорректно выключаете?

0
Sakura-chan - 2 Май, 2014 - 23:28
Изображение пользователя Sakura-chan.

Да нет вроде. Периодически случаются перебои по питанию, но это раз 10 было. Сейчас бесперебойник временно умер, к сожалению. Явно не 49 раз.

Правда, пока я экспериментировал, запустил самотестирование. При выводе результатов теста всё зависло намертво, в консоль тока выдало кучу ошибок доступа к диску. И SSD пропал вообще. Даже ресет не помог, биос его не видел, пока не выключил полностью питание и включил снова. И стало power loss 150. Если предположить, что в биосе кнопка питания выключает более-менее корректно, то это либо ресет, либо когда он сам пропал.

В общем, понесу отдавать в гарантию.

+1
GreatKir - 2 Май, 2014 - 14:16
Изображение пользователя GreatKir.

SSD_Life_Left - 0
Что-то не то с SSD

0
Sakura-chan - 2 Май, 2014 - 16:26
Изображение пользователя Sakura-chan.

А тут в FAQ по smartmontools пишут, что RAW у этого параметра всегда ноль, и надо смотреть VALUE:

The SSD_Life_Left Attribute of my new SandForce based SSD reports zero

It doesn't. The RAW value of this attribute is always 0 and has no meaning. Check the normalized VALUE instead. It starts at 100 and indicates the approximate percentage of SDD life left. It typically decreases when Flash blocks are marked as bad, see the RAW value of Retired_Block_Count:

Ссылка на FAQ: перейти

Отправить комментарий

CAPTCHA на основе изображений
Введите цифры