Bug 32934

Summary: Падает (general protection), если дисков больше 50 шт.
Product: Sisyphus Reporter: Lenar Shakirov <snejok>
Component: propagatorAssignee: Michael Shigorin <mike>
Status: CLOSED FIXED QA Contact: qa-sisyphus
Severity: normal    
Priority: P3 CC: aen, george, ldv, mike, rider, sbolshakov, sem
Version: unstable   
Hardware: all   
OS: Linux   
URL: http://imgur.com/a/dOu3T

Description Lenar Shakirov 2016-12-21 20:11:40 MSK
Нет возможности дебажить /usr/sbin/propagator: слишком рано запускается

При установке SPT7 ловлю это при запуске /usr/sbin/propagator (см. ссылку на скриншот):
===================================
wait_status: 11, install exited abnormally -- received signal 11
sending termination signals...done
sending kill signals..done
unmounting filesystems...
/proc
/sys
/dev umount failed
you may safely reboot your system
====================================

При этом не могу это дебажить,
ибо /usr/sbin/propagator запускается из
scripts/pre/prepare/000-propagator,
но еще даже
lib/initrd/modules/010-cmdline не выполнился,
соответственно опции ядра (STOP=, IGNORE=) для вываливания в shell не работают

propagator-debug срабатывает уже после /usr/sbin/propagator

Возможно стоит перенести
scripts/pre/prepare/000-propagator
в
scripts/post/cmdline/000-propagator
либо в
scripts/pre/fstab/000-propagator

либо добавить условия вываливания в shell в scripts/pre/prepare/000-propagator

rdinit=/bin/sh не помогает, ибо там где проблема нет ps/2 входа, а usbhid модули еще не подгружены
Comment 1 Lenar Shakirov 2016-12-23 06:36:51 MSK
Прошу извинить, оказалось что в make-initrd все легко дебажится,
если юзать не
stop=,all,
а
STOP=,all,

и плюс RESCUE_MODULES="usbhid ehci_hcd hid_generic evdev ehci_pci ipmi_si"
тогда можно жить.

А из propagator можно вывалиться если указать automatic=0

Однако выяснилось, что падает propagator по причине большого кол-ва дисков.
В dmesg вижу:
traps: propagator[761] general protection ip:49cc5f sp:7fffdcd97cf0 error:0 in propagator[400000+1240000]

думаю что падает в функции "get_medias":
http://git.altlinux.org/gears/p/propagator.git?p=propagator.git;a=blob;f=probing.c#l238

 241         char * tmp_names[50];
 242         char * tmp_models[50];

пока обошел так:
ctrl+alt+F2
modprobe -r mpt3sas
echo "blacklist mpt3sas" > /etc/modprobe.d/my.conf

Воспроизвел в VirtualBox поменяв чипсет с PIIX на ICH9 и добавив два SATA контроллера (ибо максимум 30 устройств на один SATA)
Comment 2 Anton Farygin 2016-12-23 07:44:02 MSK
Миша, расширь пожалуйста количество дисков до 250.
По идее не должно вызвать никаких проблем.
Comment 3 Michael Shigorin 2016-12-24 16:31:20 MSK
(В ответ на комментарий №2)
> Миша, расширь пожалуйста количество дисков до 250.
Э, не, погоди :]

(В ответ на комментарий №1)
> Прошу извинить, оказалось что в make-initrd все легко дебажится,
> если юзать не
> stop=,all,
> а
> STOP=,all,
[...]
> А из propagator можно вывалиться если указать automatic=0
Добавь на http://altlinux.org/propagator со ссылкой сюда, пожалуйста.

> Однако выяснилось, что падает propagator по причине большого кол-ва дисков.
А сколько их в твоём случае доступно, для ориентировки?
Comment 4 Lenar Shakirov 2016-12-25 23:08:47 MSK
(В ответ на комментарий №3)
> Добавь на http://altlinux.org/propagator со ссылкой сюда, пожалуйста.

Давно добавил :-)
И еще сюда: https://www.altlinux.org/Make-initrd

> А сколько их в твоём случае доступно, для ориентировки?

У меня было 60, но обещали нарастить ;-)
Comment 5 Michael Shigorin 2016-12-26 15:07:19 MSK
Просьба по возможности проверить там вот этот regular-rescue.iso,
собранный с propagator-20161226-alt1: https://yadi.sk/d/Pr_yTXOV354apE

md5: 8256574a35fe02de7d6ede049e13515c
sha1: 8aa42202e5e5495230168d73843b3c4ee29a838e
Comment 6 Lenar Shakirov 2016-12-26 17:36:52 MSK
Работает!
Comment 7 Michael Shigorin 2016-12-26 18:30:50 MSK
Спасибо!  Эх, месяцем бы раньше... :)
Comment 8 Repository Robot 2016-12-26 18:44:46 MSK
propagator-20161226-alt1 -> sisyphus:

* Mon Dec 26 2016 Michael Shigorin <mike@altlinux> 20161226-alt1
- probing.c: bump max disk number from 50 to 250 (closes: #32934)