Источник
Источник данных
Карточки клиник импортируются из открытого корейского датасета по медицинскому туризму. Когда доступны детальные эндпоинты, их данные объединяются с локальной записью, чтобы сайт мог показывать более полные профили.
Первичным авторитетом остается публичный источник. Сайт лишь переупаковывает эти записи для удобства просмотра и поиска и не претендует на замену источника.
Хранение
Зачем нужны отдельные таблицы по языкам
Каждый поддерживаемый язык хранится в отдельной таблице MySQL. Это разделяет английские, японские, китайские и русские записи и упрощает обновления, QA и поязыковые релизы.
Раздельные таблицы также упрощают возобновляемый импорт, полную перезапись, генерацию sitemap по языкам и последующие функции сайта.
Импорт
Как безопасно возобновляется импорт
Режим продолжения проверяет существующие content_id в базе и по возможности пропускает уже загруженные записи. Благодаря этому квота API тратится на новые или недостающие детали, а не на повтор уже завершенных элементов.
Режим полной перезаписи остается доступным для полной пересборки, но для регулярного обслуживания безопаснее использовать режим продолжения.
Публикация
Как записи становятся публичными страницами
Импортированные строки не становятся индексируемыми URL автоматически. В sitemap попадают только страницы, прошедшие quality gate сайта, и именно они отдаются с index,follow.
Если исходного изображения нет, запись может получить сгенерированный fallback-визуал, но одного визуала недостаточно. Перед участием в поиске странице нужны осмысленный текст, операционный контекст и медицинские детали.
Региональные и регионально-специализационные хабы тоже публикуются выборочно. Они включаются в sitemap только при достаточном числе подходящих клиник и достаточной глубине самой агрегированной страницы.