Поскольку сочувствующего проекту специалиста по machine learning пока найти не удалось, а идеи требуют реализации, продолжаю "пилить как умею". Сделал стрипам плашки "похожие стрипы" (
пример). Конечно, таких связей между стрипами пока отслежено исчезающе мало. И добавлять их приходится руками, а не с помощью могучего нейронного интеллекта. Но: во-первых, это лучше, чем ничего. А во-вторых, продолжаю надеяться на деятельных энтузиастов (да, я оптимист).
Что касается реализации. Это чудовищно просто (и, подозреваю, с точки зрения "настоящих дата-сайентистов" абсолютно неправильно): в базе создана отдельная табличка, в которой каждая строка - это перечисленные через пробел номера группы похожих друг на друга стрипов. Решение простое, как топор, и такое же изящное, но уж что есть.
В лучшем из миров у Архива есть шарящий в машинном обучении товарищ, который натренирует специальную нейросеть проставлять некое поле тегов стрипам. А по этому полю тегов можно будет судить о похожести стрипов. Но в нашем мире такого товарища пока не нашлось, продолжаю искать.