Nano Hash - криптовалюты, майнинг, программирование

Считайте файл Unicode UTF-32 в wstring

Для UTF-16 мы можем читать и преобразовывать его в wchar одновременно. Например,

std::wifstream* file = new std::wifstream(name, ifstream::binary);
locale lo = locale(file->getloc(), new std::codecvt_utf16<wchar_t, 0x10ffff, std::little_endian>);
file->imbue(lo);

Как я могу сделать то же самое для ввода UTF-32?

25.10.2016

  • из std::codecvt_utf16 можно использовать std::codecvt_utf16<char32_t> 25.10.2016
  • Возможный дубликат преобразования std::u32string в/из std::string и std: :u16строка 25.10.2016
  • @danh, возможно, не совсем дубликат - хотя я предполагаю, что вы можете просто заменить std::codecvt_utf16<char32_t> на imbue()? (Я действительно не знаю, мне самому всегда нужна UTF-8) 25.10.2016
  • Это в винде? Какой компилятор/версию вы используете? 01.11.2016

Ответы:


1

Вы можете использовать классический шаблон C++ для выделения wifstream в стеке вместо кучи (new):

std::wifstream* file = new std::wifstream(name, ifstream::binary);
std::wifstream file(name, ifstream::binary);

Что касается codecvt, я бы попробовал std::codecvt_utf16<char32_t>.

P.S. Обратите внимание, что wchar_t может иметь разные размеры (16 бит, 32 бита) на разных платформах. Поэтому вам может быть лучше использовать std::u16string для UTF-16 и std::u32string для UTF-32.

25.10.2016
  • Кодеквт std::codecvt_utf16‹char32_t› не работает. Я думаю, мне нужно что-то вроде std::codecvt_utf32, которого не существует. Могу ли я создать свой собственный? Спасибо. 27.10.2016
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..