Основные этапы преобразования данных в БД
Учитывая приведенные проблемы, рассмотрим пути их решения. Отметим, что промышленная эксплуатация систем, работающих с БД, может продолжаться достаточно долго. При этом изменяются прикладные программы, работающие с БД, повторно преобразуются данные, если в систему введена новая БД, а часть ранее определенных данных уже перенесены в новую БД.. Это влечет за собой доработку прикладных программ доступа к данным, чтобы приспособить их к измененной структуре новой БД или к старой БД. Для переноса данных из старой БД в новую разрабатываются скрипты с приведенной логической структурой БД или DBF–файлы, которые вначале размещаются в транзитной БД, а затем с учетом особенностей новой основной БД переносятся в нею. Может оказаться, что процесс приведения структур транзитной БД к новой окажется нецелесообразным и разработку новой БД проводить "с нуля". При этом заполненные справочники и классификаторы потребуется дополнить появившимися новыми данными.
Проблемы преобразования данных при использовании разных СУБД возникают из–за того, что данные имеют различные способы хранения, среди которых могут быть несовместимые типы данных, а также доступ к данным осуществляется разными языками манипулирования данных, используемых СУБД.
Преобразование данных может проводиться несколько раз путем создания специальных скриптов и файлов с учетом ранее введенных данных, снятия дублирования данных и корректного приведения несовместимых типов данных При этом могут возникнуть ошибки, связанные с изменением форматов данных, дополнением старых справочников новыми данными и т.п.
Этапы преобразования данных. Процесс преобразования данных состоит из трех главных частей:
1. Перенос данных между СУБД (перенос данных из старой БД в транзитные файлы и затем занесение данных из этих файлов в транзитную БД;
2. Обработка данных в транзитной базе в случае изменения кодировки данных, приведение в соответствие структур старой и новой баз данных, а также кодов справочников и классификаторов;
3. Перенос данных из транзитной базы в основную базу данных и проверка преобразования данных.
Первый метод замены представляет собой наиболее безболезненный для пользователей и разработчиков.
Второй метод замены представляет собой создание нового проекта системы на основе имеющейся модели данных. При третьем варианте создается система заново и в новую БД заносятся унаследованные данные из старой БД. Поскольку структуры БД различны, то создаются, как правило, временные приложения, осуществляющие нужные преобразования данных в процессе их переноса в новую БД.
При применении первого и второго метода структура старой БД сохраняется и никакого преобразования данных и соответствия справочников и классификаторов не требуется – они используют единый формат хранения данных.