Notes |
|
|
Также рандомно падает при TBerkeleyDBPool.Acquire (elf - в аттаче) |
|
|
|
Кэш Беркли - неверсионный |
|
|
(0011934)
|
zed
|
30-06-2013 17:35
|
|
|
|
(0011935)
|
zed
|
30-06-2013 17:40
|
|
И не помешало бы прогнать кэш новой версией sdb_util в режиме "Restore cache after crash: Recover & Verify (default)" (первый пункт из списка) и приложить сюда лог. |
|
|
(0011936)
|
rudepravo
|
30-06-2013 18:04
(edited on: 30-06-2013 18:05) |
|
Прогнал. sdb_util ничего ошибочного не нашёл, а тем не менее Гугл-падает в строке 184 на любых масштабах. Может свою Беркли-базу(масштабов z1-z7) куда-то выложить?
sdb.log - в аттаче
|
|
|
(0011937)
|
zed
|
30-06-2013 18:10
|
|
Вот в чём проблема: BerkeleyDB Env: unable to join the environment u:\sasplanet\cache_db\sat\
Возможно, если вы удалите файл __db.register в папке env, то это поможет. |
|
|
|
|
|
(0011939)
|
zed
|
30-06-2013 18:33
|
|
В папке env должно было остаться всего 2 файла: log и DB_CONFIG, правильно?
Меня смущает, что оно ругается на папку sat, хотя по идее, должно бы на папку sat\env\
Добавьте в DB_CONFIG строчки:
set_verbose DB_VERB_DEADLOCK
set_verbose DB_VERB_FILEOPS
set_verbose DB_VERB_FILEOPS_ALL
set_verbose DB_VERB_RECOVERY
set_verbose DB_VERB_REGISTER
set_verbose DB_VERB_REPLICATION
set_verbose DB_VERB_REP_ELECT
set_verbose DB_VERB_REP_LEASE
set_verbose DB_VERB_REP_MISC
set_verbose DB_VERB_REP_MSGS
set_verbose DB_VERB_REP_SYNC
set_verbose DB_VERB_REP_SYSTEM
set_verbose DB_VERB_REPMGR_CONNFAIL
set_verbose DB_VERB_REPMGR_MISC
set_verbose DB_VERB_WAITSFOR
и после перезапуска САСа, в папке с кэшем должен появиться msg.log. Возможно из него будет более понятно, что там с env.
Ну и самое последнее, что могу предложить, так это сделать Reset lsn и полностью удалить папку env. Начать с чистого листа, если так можно сказать. |
|
|
(0011949)
|
rudepravo
|
01-07-2013 18:08
(edited on: 01-07-2013 18:12) |
|
На z6 прогнал ещё раз sdb_util, ругается на то, что 71Gb ему не хватает для восстановления. Тоже самое на z7. База всё - погибла?
Логи msd.log и no_space_sdbutil.log - в аттаче.
PS: оказывается что места sdb_util не хватало на диске C:
|
|
|
(0011951)
|
zed
|
01-07-2013 18:13
|
|
Подождите, только что, вы писали что с файлами БД всё в порядке, и тут вдруг на ровном месте какие-то ошибки. Что изменилось с прошлой проверки? |
|
|
|
Да ничего не поменялось. Я откатился на релизную 121010, что-то ей поковырял, а потом прогнал на кэше ещё раз sdb_util и получил следующий error:
>> db_verify 9.4.sdb [U:\SASPlanet\cache_db\sat\z13\2\1\]
db_verify: Page 25643: incorrect prev_pgno 25655 found in leaf chain (should be 317791)
db_verify: Page 51107: bad prev_pgno 51108 on overflow page (should be 51106)
db_verify: Page 51106: bad prev_pgno 51105 on overflow page (should be 51107)
db_verify: Page 51106: overflow page linked twice from leaf or data page
db_verify: Page 71058: first page in overflow chain has a prev_pgno 71059
db_verify: Page 67139: overflow item incomplete
db_verify: Page 73091: first page in overflow chain has a prev_pgno 73092
db_verify: Page 73091: overflow item incomplete
db_verify: Page 75078: first page in overflow chain has a prev_pgno 75079
db_verify: Page 73091: overflow page linked twice from leaf or data page
db_verify: Page 77037: first page in overflow chain has a prev_pgno 77038
db_verify: Page 77037: overflow item incomplete
db_verify: Page 78971: first page in overflow chain has a prev_pgno 78970
db_verify: Page 77069: overflow item incomplete
db_verify: Page 71069: first page in overflow chain has a prev_pgno 86471
db_verify: Page 71058: overflow page linked twice from leaf or data page
db_verify: Page 73108: first page in overflow chain has a prev_pgno 73109
db_verify: Page 73108: overflow page linked twice from leaf or data page
db_verify: Page 75094: first page in overflow chain has a prev_pgno 86468
db_verify: Page 75078: overflow page linked twice from leaf or data page
db_verify: Page 77046: first page in overflow chain has a prev_pgno 77047
db_verify: Page 75095: overflow item incomplete
db_verify: Page 75110: first page in overflow chain has a prev_pgno 77046
db_verify: Page 75110: overflow page linked twice from leaf or data page
db_verify: Page 77055: first page in overflow chain has a prev_pgno 77056
db_verify: Page 77046: overflow page linked twice from leaf or data page
db_verify: Page 77055: overflow page linked twice from leaf or data page
db_verify: Page 75094: overflow page linked twice from leaf or data page
db_verify: Page 71069: overflow page linked twice from leaf or data page
db_verify: 9.4.sdb: DB_VERIFY_BAD: Database verification failed
Verification of 9.4.sdb failed.
Сейчас делается "Restore broken files from *.bad [cmd: db_dump && db_load]" |
|
|
(0011957)
|
zed
|
01-07-2013 18:28
|
|
>Да ничего не поменялось
Ну да, только: "PS: оказывается что места sdb_util не хватало на диске C:"
>Я откатился на релизную 121010
Кэш открылся? Хотя, судя по тому, что она успела напакостить как минимум в одном из файлов БД, оно таки сумело сджоинить энвайронмент. |
|
|
(0011961)
|
rudepravo
|
01-07-2013 18:49
(edited on: 01-07-2013 18:52) |
|
Вот сейчас висит db_dump уже 21 минуту, файл 9.4.sdb.dump не растёт в размере. Это нормально?
Я ещё до кучи в env потёр все log-файлы, такое допустимо?
>Кэш открылся?
Нет. Выставил масштаб z3, всё равно экран пустой и ошибка на строке 184.
Считать, что кэш безвременно погиб и перекачивать всё заново?
|
|
|
(0011962)
|
zed
|
01-07-2013 18:52
|
|
>Вот сейчас висит db_dump уже 21 минуту, файл 9.4.sdb.dump не растёт в размере. Это нормально?
Нет.
>Я ещё до кучи в env потёр все log-файлы, такое допустимо?
Нет. Теперь нужно делать Reset LSN всему кэшу, а потом опять прогонять verify. |
|
|
(0011963)
|
zed
|
01-07-2013 20:38
|
|
>Считать, что кэш безвременно погиб и перекачивать всё заново?
Нет конечно. |
|
|
|
После прогона по всем базам новой sdb_util и удалению зависших sdb-шек тайлы открылись, тикет можно закрывать.
Проблема была наверное в том, что побились 2 sdb-шки в z9 и z14, после этого всё поехало дальше. Почему были затронуты базы других зумов - не знаю, работает сейчас и работает. |
|
|
(0011970)
|
zed
|
01-07-2013 21:36
|
|
На будущее:
- никогда не удаляйте файлы лога
- не запускайте без надобности Reset LSN
- никогда больше не используйте релиз 121010 для кэша Беркли |
|