Мне нужно заменить значения в большом файле CSV, и я выбрал Python в качестве языка программирования, который я хочу использовать.
Значение, которое мне нужно изменить, является первым в каждой строке моего CSV, разделенного запятыми:
ToReplace, a1, a2, ..., aN
1, ab, cd, ..., xy
80, ka, kl, ..., df
Это всегда число, хотя количество цифр не является фиксированным.
На данный момент у меня есть две идеи: обрабатывать данные построчно и...
- Используйте регулярное выражение для сопоставления числа
- Используйте компонент CSV для анализа строки
Поскольку я новичок в Python, у меня возникло несколько вопросов:
- Учитывая размер файла (> 50 ГБ; ~ 10 миллионов строк), какой метод быстрее?
- Как это реализовать, не тратя много ресурсов?