Imageman72: Фото, алгоритмы и прочие (original) (raw)
Казалось бы, простая задача — найти нужные символы на схеме (в данном контексте под символами я имею в виду пиктограммы, а не текстовые буквы). Для подобной задачи есть множество нейросетей, самая известная из которых YOLO. Работает быстро, есть целый зоопарк различных версий, отработанный механизм обучения. Если бы не одно большое «но» — у нас открытый мир. Рядом с каждой схемой есть легенда и пиктограммы с этой легенды нам и нужно найти. Мы не знаем всех символов, которые нам будут попадаться, более того, прямо сказано, что масштаб и поворот может меняться, сами схемы очень плотные, там буквально один символ на другом сидит. Казалось бы, есть и для открытого мира решения YOLO World, OWLv2 и нельзя забывать про старые методы по типу cv2.matchTemplate или chamfer-matching.

(один из синтетических примеров обучения)
В принципе у меня похожие эмоции. В своё время мне довелось посмотреть несколько учебников (физики, химии), начиная примерно с 1957 года до 1990 года. Если в 50-х годах было довольно простое объяснение, введение в тему, упор на практику и примеры из жизни, то ближе к 90-м учебники стали более сухими. Меня всегда подбешивало много теории и до обидного мало практики. К примеру кто из нас знает хотя бы приблизительно почему ученые пришли к выводу, что Солнце очень далеко?
На самом деле всё ещё хуже — многие (40-летние) не могут вычислить 1990 + 22% без калькулятора (с кнопкой "%").
Кстати это не только у нас:
Байка про Фейнмана и лекало
Однажды на лекции Фейнман показал студентам лекало (гибкую изогнутую линейку, которую можно изгибать в разные формы). Он задал вопрос:
"Если я подвешу лекало за какую-то точку, где касательная будет горизонтальна?"
Студенты начали строить сложные рассуждения, вспоминать формулы, думать о центрах масс и интегралах.
Фейнман же просто взял лекало, подвесил его за нитку, и оно повисло.
"Вот, смотрите: в самой нижней точке касательная всегда горизонтальна!" — сказал он.
Посмотреть обсуждение, содержащее этот комментарий
Привет, друзья!
В последнее время я развлекался созданием наборов иконок, вдохновленных классическими сказками и мифическими существами. Возможно, кому-то из вас они пригодятся как элементы дизайна или даже вдохновят на создание нового логотипа!
( Читать дальше...Свернуть )
Понадобилось мне как-то недавно обучить нейросеть для прогнозирования временных рядов. Дело для меня новое, но каких-то особых трудностей не предвиделось. После короткого поиска было решено за основу взять GRU.
Stable Diffusion и еще пару нейросетей позволяют сгенерировать фотографии. При этом можно использовать текстовые описания.
Под капотом ссылки на несколько статей и пару блокнотов на Colab.
Понадобилось мне сделать набор резких картинок (т.е. из большого набора выкинуть все нерезкие фотографии, как на примере ниже)

Сначала я попробовал старые классические методы (сразу же в поисковике выскакивает Laplacian - простенький сверточный фильтр). Для отсеивания явного брака может сгодится, но много ложных срабатываний. К примеру размытие в движении (motion blur), шумные картинки и т.п. ему не по зубам. Попадались и более сложные реализации (с пирамидальным масштабированием и вычислением частот). Но все встреченные реализации часто давали ошибки и (зачастую) медленно работали.
Пойдем путем ИИ. Дальше будет описание проблем построения и обучения нейросети. (Забегая вперед - аккуратность получилась лучше 96%.)
( Хочу все детали и поподробнее!Свернуть )
Муж на днях мне заявил, что я не разнообразно готовлю! Позавчера готовила спагетти, вчера рожки, сегодня ракушки, завтра планирую сварить бантики... Оборзел совсем! Я в шоке, дождется... посажу на одни макароны!
--------------------------
— У меня что-то колет в боку...
— Это — доброта и доверчивость.
— В смысле?
— В смысле... Это они обычно выходят боком.
--------------------------
— Сегодня на кухне буду новую мойку ставить!
— А чем тебя старая не устроила?
— Низкая, чтобы из крана воды в чайник набрать, надо в ней всю посуду перемыть!
( Читать дальше...Свернуть )
"– А как будет правильно: поехать отдыхать «на Украину» или «в Украину»? – Правильно будет – в Швейцарию."
"Звонок злобного юзера сисадмину: — Не могу войти в систему! — Пароль правильно набираете? — Ну конечно! Пять звездочек..."
"— Милый, я тут пригласительные открытки подписываю, как правильно написать: «годавщина» или «гадовщина»? — Пиши — «ебилей»!"
"- Пап, а как правильно написать: Герасим утопил 25 мум, мумей или мумов? - Напиши просто - мумифицировал реку."
Вчера я писал про кластеризацию и жаловался, что готовый алгоритм делает кластеры слишком уж разной величины (почитать там). А сегодня я расскажу про сравнение двух велосипедов иерархической кластеризации.
Дальше немного рисунков, немного размышлений...( Читать дальше...Свернуть )
"- Нам пора перейти к серьёзным отношениям. Я устала от неопределённости, устала ждать. - Ну-ну, я просто фото лайкнул!.."
" — Я просто замкнутая. — И давно замкнуло?"
"Есть ли во мне изюминка? Во мне масса изюминок! Да я просто кексик!"
В последнюю неделю развлекаюсь тем, что в Питоне пытаюсь рассортировать анекдоты по разным классам.
( Дальше немного кода на Python, немного размышлений и пояснений...Свернуть )
Исходный код https://github.com/Imageman/aneki
Продолжение https://imageman72.livejournal.com/49467.html
Есть люди у которых жизнь, как зебра, есть люди у которых жизнь как малина, есть и такие с которых Малевич нарисовал свой «Черный квадрат»!

Министры образования хотят ввести экзамен с четвертого класса. А чё с четвертого? Давайте вступительный в первый! Не сдал — все, вали работать.
--------------------------
Оператор в банке клиенту:
- Назовите серию и номер паспорта.
Клиент:
- Моего?!
Оператор:
- Ну если сможете, назовите моего!
--------------------------
- "Кто же так складывает вещи.." - бормотала жена, переукладывая основной и запасной парашюты мужа перед его первым прыжком...
( Читать дальше...Свернуть )