Как вы и сами прекрасно можете себе представить, реализовать текстовый поиск по четырнадцати с лишним тысячам довольно мелких картинок - задача, мягко говоря, нетривиальная. Выходов мне виделось два: либо энтузиасты со временем помогли бы мне переписать текст со стрипов, либо каким-то образом распознать весь текст программно. У обоих вариантов есть свои огромные «но», и задача оставалась долгие годы нерешённой, пока сайт GoComics не поменял свой дизайн. Где связь? Сейчас поясню.
Ни для кого не секрет, что для перевода стрипов про Гарфилда нужно откуда-то брать их оригиналы. И довольно долгое время я их беру с GoComics. Причём, конечно, не вручную, а автоматически, специальным скриптом. И вот в одно прекрасное утро этот самый скрипт сказал мне «насяльника, не вижу свежей картинки!». Разумеется, пришлось грузить сайт вручную и смотреть, что такое стряслось. А стряслось то, что сайт кардинально поменял дизайн, и комикс теперь грузится не так, не туда и не тогда. Вот чёрт их дёрнул формат менять, всё же нормально было! Короче, «на колу мочало, начинай сказку по анализу сайта сначала». И вот тут самое интересное: в процессе разборки страницы я нашёл, что на ней присутствует ещё и текст стрипа! Слегка прикопан, но вполне различим и выделяем! Но ко всем ли стрипам он есть? Я открыл самый первый стрип. Текст есть. Открыл случайный стрип за 80-й год. Есть. Я потёр руки и занёс их над клавиатурой...
Через несколько часов свежеиспеченый скрипт выудил текст от самого последнего на тот момент стрипа, а еще через двадцать минут под каждым стрипом на
сайте архива появился текст оригинала. «Не было бы счастья, да несчастье помогло», как говорится!