экстремальный новичок в python/sql здесь. Я искал помощь в этом, но не смог найти именно то, что мне нужно, - буду очень признателен за любую помощь.
Как видно из названия, у меня есть очень большой текстовый файл, который я хочу преобразовать в базу данных sql, предпочтительно используя python. Текстовый файл настроен так:
#Parent field 1.1
child 1.1
child 1.1 continued
# Parent field 1.2
child 1.2
# Parent field 1.3
child 1.3 text
child 1.3 text
more child 1.3 text
...
# Parent field 1.88
child 1.88
#Parent field 2.1
child 2.1
etc...
Некоторые ключевые моменты о списке:
- первое поле (т.е. 1.1, 2.1) не имеет пробела после #
- длина каждой дочерней строки имеет переменную длину символов и разрывы строк, но перед следующей родительской строкой всегда есть пустая строка
- есть 88 полей для каждого родителя
- есть сотни родительских полей
Теперь я хотел бы, чтобы каждое родительское поле (1.1, 1.2, 1.3 --> .88) было столбцом, а строки заполнялись последующими числами (2.1, 3.1 --> 100s)
Может ли кто-нибудь помочь мне настроить скрипт Python и дать мне какое-то направление, как начать синтаксический анализ? Дайте мне знать, если я не объяснил задачу должным образом, и я быстро предоставлю более подробную информацию.
Спасибо большое!
Бен
РЕДАКТИРОВАТЬ: я только что понял, что количество столбцов НЕ является константой 88, это переменная
parvals = line.split(' ')
, а затем''.join(parvals)
и получить унифицированный родительский идентификатор. 18.01.2013