如何在Windows下使用mingw打开ifstream文件的unicode文件?

请注意,这与使用unicode文件名打开std :: fstream(ofstream或ifstream)不同。 这个问题是关于一个unicode 文件名 ,这个是关于一个unicode文件的内容

我需要用ifstream打开一个UTF-8 unicode文件(包含西班牙文字符)。 在Linux下这是没有问题的,但是在Windows下它是。

bool OpenSpanishFile(string filename)
{
    ifstream spanishFile;
    #ifdef WINDOWS
    spanishFile.open(filename.c_str(),ios::binary);
    #endif

    if (!spanishFile.is_open()) return false;
    spanishFile.clear();
    spanishFile.seekg(ios::beg);
    while (spanishFile.tellg()!=-1)
    {
        string line="";
        getline(spanishFile,line);
        //do stuff
        cout << line << endl;
    }
    return true;

}

我在Linux下编译它:

i586-mingw32msvc-g++ -s -fno-rtti test.cpp test.exe

然后在wineconsole test.exe运行它。

输出包含各种奇怪的字符,所以它会尝试打开unicode文件,使其不同。

我已经在互联网上搜索了很多关于如何以这种方式打开一个unicode文件,但我无法实现它的工作。

有没有人知道可以与mingw一起工作的解决方案? 提前谢谢你。


很可能(不清楚呈现的代码是否是真正的代码)您看到垃圾的原因是Windows中的std::cout默认将结果呈现在非UTF-8控制台窗口中。

为了正确检查你是否正确读取UTF-8文件,只需收集一个字符串中的所有输入,将其从UTF-8转换为UTF-16 wstring ,然后使用MessageBoxW (或宽直接控制台输出)显示该文件。

以下UTF-8→UTF-16转换函数与Visual C ++ 12.0很好地协同工作:

#include <codecvt>          // std::codecvt_utf8_utf16
#include <locale>           // std::wstring_convert
#include <string>           // std::wstring

auto wstring_from_utf8( char const* const utf8_string )
    -> std::wstring
{
    std::wstring_convert< std::codecvt_utf8_utf16< wchar_t > > converter;
    return converter.from_bytes( utf8_string );
}

不幸的是,尽管它只使用标准的C ++ 11功能,但它无法使用MinGW g ++ 4.8.2进行编译,但希望您拥有Visual C ++(毕竟它是免费的)。


作为替代方案,您可以使用Windows API MultiByteToWideChar编码转换函数。

例如,下面的代码在-D USE_WINAPI与g ++ 4.8.2很好地-D USE_WINAPI

#undef UNICODE
#define UNICODE
#include <windows.h>
#include <shellapi.h>       // ShellAbout

#ifndef USE_WINAPI
#   include <codecvt>          // std::codecvt_utf8_utf16
#   include <locale>           // std::wstring_convert
#endif
#include <fstream>          // std::ifstream
#include <iostream>         // std::cerr, std::endl
#include <stdexcept>        // std::runtime_error, std::exception
#include <stdlib.h>         // EXIT_FAILURE
#include <string>           // std::string, std::wstring

namespace my {
    using std::ifstream;
    using std::ios;
    using std::runtime_error;
    using std::string;
    using std::wstring;

    #ifndef USE_WINAPI
        using std::codecvt_utf8_utf16;
        using std::wstring_convert;
    #endif

    auto hopefully( bool const c ) -> bool { return c; }
    auto fail( string const& s ) -> bool { throw runtime_error( s ); }

    #ifdef USE_WINAPI
        auto wstring_from_utf8( char const* const utf8_string )
            -> wstring
        {
            if( *utf8_string == '' )
            {
                return L"";
            }
            wstring result( strlen( utf8_string ), L'#' );  // More than enough.
            int const n_chars = MultiByteToWideChar(
                CP_UTF8,
                0,      // Flags, only alternative is MB_ERR_INVALID_CHARS
                utf8_string,
                -1,     // ==> The string is null-terminated.
                &result[0],
                result.size()
                );
            hopefully( n_chars > 0 )
                || fail( "MultiByteToWideChar" );
            result.resize( n_chars );
            return result;
        }
    #else
        auto wstring_from_utf8( char const* const utf8_string )
            -> wstring
        {
            wstring_convert< codecvt_utf8_utf16< wchar_t > > converter;
            return converter.from_bytes( utf8_string );
        }
    #endif

    auto text_of_file( string const& filename )
        -> string
    {
        ifstream f( filename, ios::in | ios::binary );
        hopefully( !f.fail() )
            || fail( "file open" );
        string result;
        string s;
        while( getline( f, s ) )
        {
            result += s + 'n';
        }
        return result;
    }

    void cpp_main()
    {
        string const    utf8_text   = text_of_file( "spanish.txt" );
        wstring const   wide_text   = wstring_from_utf8( utf8_text.c_str() );
        //ShellAbout( 0, L"Spanish text", wide_text.c_str(), LoadIcon( 0, IDI_INFORMATION ) );
        MessageBox(
            0,
            wide_text.c_str(),
            L"Spanish text",
            MB_ICONINFORMATION | MB_SETFOREGROUND
            );
    }
}  // namespace my

auto main()
    -> int
{
    using namespace std;
    try
    {
        my::cpp_main();
        return EXIT_SUCCESS;
    }
    catch( exception const& x )
    {
        cerr << "!" << x.what() << endl;
    }
    return EXIT_FAILURE;
}

在这里输入图像描述

链接地址: http://www.djcxy.com/p/54643.html

上一篇: How to open unicode file with ifstream using mingw under Windows?

下一篇: Read/Write file with unicode file name with plain C++/Boost