Поэтапное зависание графической подсистемы [Решено]

Изображение пользователя GreatKir.

Приветствую!
Довольно странная проблема обнаружилась. Поэтапные зависания различных программ или систем.
Пример:
1. Firefox отказывается открывать ссылку (долго думает). Нажимаю несколько раз - как будто удаленный сервер не отвечает. Потом подвисает само окно браузера. Если в этот момент убить браузер, то проблема исчезает. Можно снова запустить браузер и работать дальше.
2. Если не убить браузер сразу, то может подвиснуть плазма. Менеджер окон может работать (окна перемещаются), но любые компоненты плазмы не реагируют на нажатия. Иногда получается убить браузер немного раньше этого момента - тогда браузер умирает, плазма падает, но сама поднимается. После этого всё работает.
3. Если попробовать перейти по ctrl+alt+f1 в консоль, то подвисает вся графика уже полностью. Помогает только перезагрузка с помощью sysrq+REISUB

Никак не могу понять, что это может быть. В логах пусто. В браузере работаю чаще всего, поэтому, как правило, проблема проявляется в нем. Но пару раз было и с другими программами.
Подскажите, люди добрые, что это может быть?

0
DarkneSS - 19 Апрель, 2013 - 20:19
Изображение пользователя DarkneSS.

Для начала попробовать другой браузер.

0
GreatKir - 20 Апрель, 2013 - 00:11
Изображение пользователя GreatKir.

Как я уже описал в проблеме, иногда такое же происходит и в других программах.

0
GreatKir - 20 Апрель, 2013 - 00:12
Изображение пользователя GreatKir.

Читайте, пожалуйста, внимательно.
В логах пусто. Скучно - не читайте вообще. Если Вам кажется, что я пишу бред, тоже не читайте.
Пробовал ставить драйвер nouveau - то же самое.

0
DarkneSS - 20 Апрель, 2013 - 14:19
Изображение пользователя DarkneSS.

Может, перегрев?

0
GreatKir - 20 Апрель, 2013 - 15:17
Изображение пользователя GreatKir.

Да, нет, исключено. Температуры нормальные.
Ещё момент - даже когда подвисли все приложения, курсор двигать можно. А когда пробую перейти в текстовую консоль, подвисает и он.
Может, попробовать вызывать падение плазмы и посмотреть, какую отладочную информацию она предоставит. Это как-то может помочь?

0
DarkneSS - 20 Апрель, 2013 - 15:41
Изображение пользователя DarkneSS.

Если после падения вылазит доктор конки, то можно дойти до конца и открыть баг или найти похожие, в комментах к которым может быть решение.

0
DarkneSS - 20 Апрель, 2013 - 15:44
Изображение пользователя DarkneSS.

В качестве брейнсторма: если есть возможность, откройте ssh и попробуйте зайти на зависнувший комп и глянуть во всяких топах, нет ли чего подозрительного. Также можно потестировать железо. Мемтест вроде обычно есть в грубе.

0
Гость - 21 Апрель, 2013 - 12:56

Мемтест ошибок не находит. С ssh - хорошая идея. Постараюсь применить

0
GreatKir - 21 Апрель, 2013 - 12:57
Изображение пользователя GreatKir.

C ssh - хорошая идея. Попробую применить

0
yarmol76 - 21 Апрель, 2013 - 05:13

Сделай обновление или переустановись.

0
GreatKir - 21 Апрель, 2013 - 12:57
Изображение пользователя GreatKir.

Обновление чего, мой друг?

0
yarmol76 - 22 Апрель, 2013 - 15:49

Обновление графической подсистемы :)
Может ты пакет какой-то случайно удалил/установил до этого? У меня один раз было, что установил непонятную программу, а потом не понимал, что происходит. Загляни в логи установки пакетов. Может увидешь чего.

+2
Fogma - 21 Апрель, 2013 - 14:58
Изображение пользователя Fogma.

переустановись это удел виндузятников с умершим реестром :)

0
GreatKir - 30 Май, 2013 - 12:12
Изображение пользователя GreatKir.

Нашел у человека похожую проблему: http://www.linux.org.ru/forum/general/5074205
Там всё свелось к умиранию то ли материнской платы, то ли дискового контроллера.
У меня пока удалось уменьшить количество зависаний, но проблему так и не обнаружил.
Интересный метод обнаружения ошибки в том топике - вывод логов прямо в консоль. Естественно, логи на жесткий диск записаться не смогут в случае сбоя в дисковой подсистеме. Как сделать точно такой же вывод в консоль?
Пока использую multitail, но не уверен, что это именно то, что нужно. Данные-то всё равно берутся из файла в случае с multitail

0
lord_i - 30 Май, 2013 - 14:15
Изображение пользователя lord_i.

Запустите с лив-диска программку S&M - это стресс тест материнки, памяти и блока питания с подробным логгированием, если с этими компонентами все нормально - викторией с этого же диска пройдитесь по винту. Это чтоб исключить или локализовать железные проблемы.

0
GreatKir - 30 Май, 2013 - 14:39
Изображение пользователя GreatKir.

Предлагаете воспользоваться лайв-сиди с виндовсом? На этом сайте мне пираток ещё не предлагали)

0
Mike - 30 Май, 2013 - 14:45
Изображение пользователя Mike.

Наслаждайся, чо! Только лицензию винды прикупить не забудь! =)

0
lord_i - 30 Май, 2013 - 15:09
Изображение пользователя lord_i.

А что тут такого? Вам шашечки или ехать? Кстати, софт о котором я писал - совершенно бесплатный:
Victoria
S&M
А кратковременное использование Windows PE укладывается в ознакомительный период. Так что не переживайте - я не подвергаю Ваши моральные устои опасности :)

0
GreatKir - 3 Июнь, 2013 - 21:27
Изображение пользователя GreatKir.

Заметил, что при зависании и использовании перезагрузки с помощью клавиши SysRq в логах не пишутся сообщения об этом!
Если же просто так перезагрузить этими комбинациями клавиш компьютер, то выводятся сообщения такого рода:
Jun  3 21:05:02 kirill-comp kernel: [86260.211531] SysRq : Emergency Sync
Jun  3 21:05:02 kirill-comp kernel: [86260.555498] Emergency Sync complete
Jun  3 21:05:04 kirill-comp kernel: [86262.161320] SysRq : Emergency Remount R/O

Возможно, что подвисает дисковая подсистема (диск, контроллер?)
Это объясняет причину того, что в логах ничего не пишется.

Вопрос вот в чем - как всё-таки прочитать логи и узнать, что происходит? Пока вариант с ssh не опробовал - впрочем, не уверен, что смогу прочитать логи таким образом.
Может, как-то можно перенеправить ведение логов на флешку?

0
DarkneSS - 3 Июнь, 2013 - 21:34
Изображение пользователя DarkneSS.

Пропишите в fstab монтирование в /var/log флешки.

0
GreatKir - 3 Июнь, 2013 - 22:04
Изображение пользователя GreatKir.

Сделал ручное монтирование пока. Посмотрим, что это даст

+6
GreatKir - 6 Апрель, 2014 - 00:30
Изображение пользователя GreatKir.

Для порядка отчитываюсь о причине и решении.

Всё дело было в том, что BIOS настраивал расширенныый контроллер прерываний APIC таким образом, что на одном и том же системном прерывании висели SATA диск и сетевая карта. Видимо, по этой причине и из-за глючной работы микросхемы APIC иногда терялось прерывание жесткого диска (сообщения lost interrupt) с полным отключением дисковой системы компьютера.

Решение

При загрузке ядра передать ему опцию noapic через GRUB. Это ограничило количество прерываний до стандартных 16, однако разбросало их гораздо эффективнее:

Как видите, eth0 и sata висят на разных прерываниях. Проблема устранена.
Может, кому пригодится.
0
aslok - 1 Июнь, 2014 - 06:41
Изображение пользователя aslok.

Что-то подвисает периодически, попробовал добавить noapic - посмотрю на результат. Сейчас выглядит так:

Попробовал - зависает намертво, сразу же после загрузки ядра грабом.

Биос выдает такую картинку по прерываниям:

Самое печальное, что подвисает не системно - я так понимаю какая-то фигня с контроллером винта происходит

0
GreatKir - 1 Июнь, 2014 - 20:28
Изображение пользователя GreatKir.

Смотрю, у вас прерывания ещё нормально распределны по умолчанию.
Так что в noapic, вероятно, смысла нет.
Надо проверять другие вероятности

0
aslok - 1 Июнь, 2014 - 22:46
Изображение пользователя aslok.

А ничего, что на десятом висят и юсб и экран и сеть? С noapic в любом случае виснет намертво, так что надо что-то другое проверять.. Только что другое? ))

0
GreatKir - 2 Июнь, 2014 - 21:03
Изображение пользователя GreatKir.

Создавайте новую тему.

0
aslok - 2 Июнь, 2014 - 22:57
Изображение пользователя aslok.

Подожду пока зависнет в следующий раз, тогда создам. Я нашел какую-то странную опцию в биосе, может быть она что-то изменит

Отправить комментарий

CAPTCHA на основе изображений
Введите цифры