Использование пользовательского интерфейса до 29.10.2018
Если вы хотите сделать это из пользовательского интерфейса. Зайдите в bigquery, щелкните левой кнопкой мыши по вашему
project -> dataset -> at the right click on cleater Table
Заполните остальную информацию
- Создать таблицу из: Google Cloud Storage
- Выберите из корзины GCS: путь к расположению вашей базы данных на GCS
- Формат файла: JSON
- В разделе схемы щелкните автоматическое определение схемы.
Это должно работать с использованием нового пользовательского интерфейса к 2018-10-29.
Использование интерфейса командной строки
Вы также можете сделать это из консоли Google, используя CLI bigquery, например
bq mk --external_table_definition=gs://yourbucket/path/yourdb --destination_format NEWLINE_DELIMITED_JSON --autodetect yourdataset.yourtablename
Последние аргументы - это имя вашего набора данных, расставленное по имени вашей таблицы.
Вам не нужно указывать файл, вы можете указать папку. О сжатии из документации BigQuery
Если вы используете сжатие gzip, BigQuery не сможет читать данные параллельно. Загрузка сжатых данных JSON в BigQuery происходит медленнее, чем загрузка несжатых данных.
Таким образом, он поддерживается, но не рекомендуется с точки зрения производительности из-за ограничений формата gz. В любом случае, если должно быть несколько небольших файлов, это не имеет значения, я думаю, что это больше связано с большими файлами gziped.
РЕДАКТИРОВАТЬ: если вам нужно указать несколько файлов, вы можете использовать подстановочный знак, например --external_table_definition=gs://yourbucket/path/yourdb/*
29.10.2018