Завис kwin

Изображение пользователя GreatKir.

Здравствуйте,
сегодня после выхода из ждущего режима система была работоспособна всего несколько секунд. Затем графический интерфейс завис. (Но курсор двигался).
В логах нашел такую ошибку:

Jul 28 12:25:01 kirill-comp kernel: [288738.967817] invalid opcode: 0000 [#1] SMP
Jul 28 12:25:01 kirill-comp kernel: [288738.967825] Modules linked in: cdc_acm rfcomm bnep bluetooth binfmt_misc nvidia(POF) snd_via82xx joydev uvcvideo snd_usb_audio videobuf2_vmalloc videobuf2_memops snd_usbmidi_lib videobuf2_core snd_hwdep videodev snd_mpu401_uart snd_via82xx_modem snd_ac97_codec gameport ac97_bus usblp snd_pcm snd_page_alloc snd_seq_midi snd_seq_midi_event snd_rawmidi snd_seq snd_seq_device snd_timer kvm_amd kvm snd serio_raw amd64_edac_mod k8temp edac_core edac_mce_amd soundcore i2c_viapro shpchp parport_pc mac_hid ppdev it87 hwmon_vid lp parport raid10 raid456 async_raid6_recov async_memcpy async_pq async_xor async_tx xor raid6_pq raid1 raid0 multipath linear hid_generic usbhid hid pata_acpi psmouse 8139too pata_via 8139cp sata_via mii floppy
Jul 28 12:25:01 kirill-comp kernel: [288738.967868] CPU: 0 PID: 2653 Comm: kwin Tainted: PF       W  O 3.13.0-32-generic #57-Ubuntu
Jul 28 12:25:01 kirill-comp kernel: [288738.967871] Hardware name: System manufacturer System Product Name/M2V-TVM, BIOS 0902    02/27/2008
Jul 28 12:25:01 kirill-comp kernel: [288738.967874] task: ffff88009bad17f0 ti: ffff88009ce38000 task.ti: ffff88009ce38000
Jul 28 12:25:01 kirill-comp kernel: [288738.967876] RIP: 0010:[<ffffffff81606aa0>]  [<ffffffff81606aa0>] sock_aio_write+0x0/0x130
Jul 28 12:25:01 kirill-comp kernel: [288738.967886] RSP: 0018:ffff88009ce39dd0  EFLAGS: 00010296
Jul 28 12:25:01 kirill-comp kernel: [288738.967888] RAX: 0000000000000000 RBX: ffff88009ce39f50 RCX: 0000000000000000
Jul 28 12:25:01 kirill-comp kernel: [288738.967890] RDX: 0000000000000001 RSI: ffff88009ce39e80 RDI: ffff88009ce39dd8
Jul 28 12:25:01 kirill-comp kernel: [288738.967891] RBP: ffff88009ce39e48 R08: ffff88009bad17f0 R09: ffffffff81606aa0
Jul 28 12:25:01 kirill-comp kernel: [288738.967893] R10: 0000000000000011 R11: 0000000000000028 R12: ffff8800b293cd00
Jul 28 12:25:01 kirill-comp kernel: [288738.967895] R13: 0000000000000028 R14: 0000000000000001 R15: 0000000000000028
Jul 28 12:25:01 kirill-comp kernel: [288738.967898] FS:  00007fb85d4bb800(0000) GS:ffff880108c00000(0000) knlGS:00000000ef6af980
Jul 28 12:25:01 kirill-comp kernel: [288738.967900] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jul 28 12:25:01 kirill-comp kernel: [288738.967901] CR2: 00007fdb92858000 CR3: 00000000b217d000 CR4: 00000000000007f0
Jul 28 12:25:01 kirill-comp kernel: [288738.967904] Stack:
Jul 28 12:25:01 kirill-comp kernel: [288738.967905]  ffffffff811bc45c ffff8800b293cd00 0000000000000000 0000000000000000
Jul 28 12:25:01 kirill-comp kernel: [288738.967909]  0000000000000000 ffff88009bad17f0 0000000000000000 0000000000000000
Jul 28 12:25:01 kirill-comp kernel: [288738.967912]  0000000000000028 0000000000000000 0000000000000000 0000000000000000
Jul 28 12:25:01 kirill-comp kernel: [288738.967915] Call Trace:
Jul 28 12:25:01 kirill-comp kernel: [288738.967923]  [<ffffffff811bc45c>] ? do_sync_readv_writev+0x4c/0x80
Jul 28 12:25:01 kirill-comp kernel: [288738.967928]  [<ffffffff811bd920>] do_readv_writev+0xb0/0x220
Jul 28 12:25:01 kirill-comp kernel: [288738.967932]  [<ffffffff8109d1ad>] ? sched_clock_local+0x1d/0x80
Jul 28 12:25:01 kirill-comp kernel: [288738.967938]  [<ffffffff8111155c>] ? acct_account_cputime+0x1c/0x20
Jul 28 12:25:01 kirill-comp kernel: [288738.967940]  [<ffffffff8109d7db>] ? account_user_time+0x8b/0xa0
Jul 28 12:25:01 kirill-comp kernel: [288738.967943]  [<ffffffff8109ddf4>] ? vtime_account_user+0x54/0x60
Jul 28 12:25:01 kirill-comp kernel: [288738.967946]  [<ffffffff811bdb10>] vfs_writev+0x30/0x60
Jul 28 12:25:01 kirill-comp kernel: [288738.967949]  [<ffffffff811bdc49>] SyS_writev+0x49/0xc0
Jul 28 12:25:01 kirill-comp kernel: [288738.967955]  [<ffffffff8172c87f>] tracesys+0xe1/0xe6
Jul 28 12:25:01 kirill-comp kernel: [288738.967956] Code: e9 e7 fe ff ff 66 0f 1f 44 00 00 2b 14 24 66 66 90 41 89 54 24 14 66 66 90 eb bb b8 ea ff ff ff e9 c7 fe ff ff e8 11 0a a6 ff 90 <66> 66 66 66 90 48 85 c9 0f 85 0b 01 00 00 55 48 89 e5 41 57 41
Jul 28 12:25:01 kirill-comp kernel: [288738.967980] RIP  [<ffffffff81606aa0>] sock_aio_write+0x0/0x130
Jul 28 12:25:01 kirill-comp kernel: [288738.967983]  RSP <ffff88009ce39dd0>
Jul 28 12:25:01 kirill-comp kernel: [288738.967987] ---[ end trace 28fb36deab9b3bee ]---

Как видно, что-то случилось с процессом kwin. Но вот что? Может, кто-то сталкивался?
Интересуюсь потому, что в последнее время система стала зависать редко, но намертво. А тут сумел выковырять что-то из логов. Возможно, причина всех проблем одна.

0
MacLeod - 28 Июль, 2014 - 14:06
Изображение пользователя MacLeod.

Ядро обновлялось между тем периодом, когда подобного не было и тем, как стало проявляться?
В теории, kwin ведь не может вешать намертво, ошибки в нем, скорее всего следствие кривого выхода из суспенда. ИМХО, либо железо "плывет", либо ошибки в ядре вызывают глюки с суспендом. Я много лет не видел зависаний никсов намертво (последний случай - mpd, работающий на уровне ядра во фре). На последнем ноуте сменилось три версии кубунты, ничего подобного не было...

0
GreatKir - 28 Июль, 2014 - 16:10
Изображение пользователя GreatKir.

Возможно, я смешал в кучу две разные проблемы.
kwin вешается только сам, консоль остаётся работоспособной. Произошло это сегодня впервые, причем не сразу после выхода из ждущего режима, а где-то через полминуты.

Намертво система несколько раз уже зависала после перехода на 14.04 (про 13.10 точно не скажу). Как правило, при просмотре видео - так что подозреваю проблемы с нвидиевским блобом. Из-за того что система зависает намертво, никаких логов не остаётся. Невозможно определить причину.
В принципе, пока всё это не напрягает, так как происходит очень редко. Но хотелось бы найти причину.
Также постараюсь в ближайшее время сделать стресс-тестирование компьютера. Может, что и выявится.

0
MacLeod - 28 Июль, 2014 - 16:23
Изображение пользователя MacLeod.

Ну, с приходом 14.04 пришло ядро 3.13, лично не сталкивался, но у нескольких знакомых возникали проблемы с железом, да и товарищ Lord_i жаловался на отвал системы управления кулерами вроде бы.
У вас проигрывание видео через vdpau или цпу? На первом проблема с блобом, если таковая имеет место, по идее, должна проявится быстрее.
Ну и, возможно, буду банален, с температурным режимом все в порядке? Качественное видео обычно греет чипаки...

0
GreatKir - 28 Июль, 2014 - 21:11
Изображение пользователя GreatKir.

Видео проигрываю через цпу, так как на моей видеокарте vdpau не поддерживается. Дело в том, что всё это как-то нестабильно зависает)). Бывало, что и не во время просмотра видео (но всё равно kwin же использует opengl)
Температуры относительно высокие, так как я снял жужжащий кулер с видеокарты, но там хорошая вентиляция в корпусе, так что они не выходят из безопасной зоны. Конечно, видеокарта всё равно может вызывать проблемы, так как она неизвестно сколько использовалась до меня, а сейчас выполняет роль затычки в слоте - лишь бы изображение давала. Так что не исключаю каких-то проблем даже в плане старых конденсаторов.

+1
lord_i - 28 Июль, 2014 - 21:45
Изображение пользователя lord_i.

в последнее время система стала зависать редко, но намертво
так как я снял жужжащий кулер с видеокарты
Как по мне - самая вероятная причина. Без "жужжащего кулера" во время работы перегревается чип GPU и некоторые выводы могут отпаяться (потерять полностью или частично контакт с платой). Что может вызвать любые эффекты. В том числе и зависание.
Нельзя снимать вентиляторы с электроники. Их туда ставят совсем не для того чтоб раздражать пользователей жужжанием.

0
GreatKir - 28 Июль, 2014 - 22:49
Изображение пользователя GreatKir.

Ну дык я и написал, что вентиляция в самом корпусе хорошая, так как над самой видеокартой висит вентилятор и дует прямо на неё.
Температура до 70 не добирается, а для этого чипа нормальная около 80-90.
Хотя всякое может быть, конечно. Может и в видеокарте дело.

+3
lord_i - 29 Июль, 2014 - 11:26
Изображение пользователя lord_i.

так как над самой видеокартой висит вентилятор и дует прямо на неё.
Правильно, когда вентилятор, расположенный сверху вытягвает воздух вверх от нагретого объекта. Таким образом удаляется горячий воздух, а его замещает холодный воздух снизу. Дуть на горячий объект сверху вниз менне эффективно.
По симптомам - очень похоже на видео. У меня были такие варианты со старыми нвидиями неоднократно. И именно после ждущего режима. Следующая фаза - карточка сдыхала полностью. Если есть возможность - поменяйте карточку и понаблюдайте.

+2
MacLeod - 29 Июль, 2014 - 13:51
Изображение пользователя MacLeod.

Да, однозначно перегрев. На винде такое наблюдал в виде быстрой перезагрузки графической оболочки, при просмотре видео, далее шло сообщение от видеодрайвера "в графическом драйвере была вызвана ошибка, он был перезагружен...". Открываю системник и вижу - кулер на видюхе встал. Видимо, блоб в линуксе при этом вызывает зависание.

0
GreatKir - 2 Сентябрь, 2015 - 12:58
Изображение пользователя GreatKir.

Проблема была в перегреве южного моста. А kwin завис сам по себе, какой-то баг в ядре (само ядро об этом в логах сообщало) - возможно, с тех пор уже поправили всё.

Отправить комментарий

CAPTCHA на основе изображений
Введите цифры