Oct
31

Пишем мобильный клиент для Google Translate на C++

Google Buzz

В этот раз я хочу рассказать о том как работать с еще одним online-сервисом, а именно с сервисом online-переводов Google Translate.

Для работы с этим сервисом у Google есть свой программный интерфейс, а именно AJAX Language API for Translation And Detection. Именно его мы и будем использовать.

Для того чтобы осуществить online-перевод текста необходимо сделать http-запрос к сервису переводов, доступному по адресу:


http://ajax.googleapis.com/ajax/services/language/translate

Параметры, которые необходимо передать сервису:

  • v=1.0 – версия сервиса
  • q= – URL-encoded текст для перевода.
  • langpair=%7C – пара названий языков: исходного и результирующего


Например для перевода текста “Hello World” с английского на русский строка запроса будет выглядеть так:


http://ajax.googleapis.com/ajax/services/language/translate?v=1.0&q=Hello%20World&langpair=en%7Cru

Ну вот, небольшой теоретический экскурс закончен, можно приступать к кодингу:
wxGoogleTranslate.h

#ifndef _WX_GOOGLE_TRANSLATE_H
#define _WX_GOOGLE_TRANSLATE_H

#include 

class wxGoogleTranslate
{
        /// \brief Language Info
        struct wxGoogleTranslateLanguageInfo
        {
                /// \brief Full language name
                wxString languageName;
                /// \brief Language code
                wxString languageCode;
        };

        /// \brief Stores information about all supported languages
        static wxGoogleTranslateLanguageInfo m_LanguageInfoArray[];
        /**
        \brief Parses JSON response from Google Translate service
        \param response contains JSON response from Google Translate service
        \param translatedText contains translated text if parsing of JSON response was correct
        \param translateionDetails contains additional information from Google Translate service
                   usually it is error message
    \param translationStatus contains parsing status (error code)
        \return true if translation and parsing was successfull, otherwise false
        */
        static bool ParseJSONResponse(const wxString & response,
                wxString & translatedText,
                wxString & translateionDetails,
                int & translationStatus);
public:
        /// \brief Returns the list of all suported languages
        /// \param result array for storing language names
        static void GetLanguages(wxArrayString & result);
        /**
        \brief Returns language code by language name
        \param languageName language name
        \return language code on success or empty string on error
        */
        static wxString GetLanguageCode(const wxString & languageName);
        /**
        \brief Translates given text with Google Translate service
        \param source string to translate
        \param result translation result
        \param sourceLanguageCode source language code
        \param resultLanguageCode destination language code
        \param translationDetails error message
        \param errorCode error code
        \return true on success, otherwise false
        */
        static bool Translate(const wxString & source,
                wxString & result,
                const wxString & sourceLanguageCode,
                const wxString & resultLanguageCode,
                wxString & translationDetails,
                int & errorCode);
};

#endif

Итак, как я уже писал выше, для того чтобы сформировать корректный URL запроса нам необходимо чтобы текст для перевода был URL-encoded. Для этоко пишем функцию URLEncode()

wxString HexFromInt(const int &value)
{
        wxString szHexHolder;

        if( value < 16)
                szHexHolder.Printf(wxT("0%x"), value );
        else
                szHexHolder.Printf(wxT("%x"), value );

        return szHexHolder.MakeUpper();
}

wxString URLEncode(const wxString &value)
{
        wxString szToReturn = wxT("");
        unsigned int nPos = 0;

        while( value.length() > nPos )
        {
                wxChar cChar = value.GetChar(nPos);

                if( (cChar >= wxT('0') && cChar <= wxT('9')) ||
                        (cChar >= wxT('a') && cChar <= wxT('z')) ||
                        (cChar >= wxT('A') && cChar <= wxT('Z')) ||
                        (cChar == wxT('-')) || (cChar == wxT('@')) ||
                        (cChar == wxT('*')) || (cChar == wxT('_')) )
                {
                        szToReturn.Append( cChar );
                }
                else
                {
                        switch( cChar )
                        {
                        case wxT(' '):  szToReturn.Append(wxT('+')); break;
                        case wxT('\n'): szToReturn.Append(wxT("%0D%0A")); break;
                        default:
                                {
                                        szToReturn.Append(wxT("%"));
                                        szToReturn += HexFromInt( cChar );
                                }
                        }
                }
                nPos++;
        }
        return szToReturn;
}

На самом деле большая часть приведенного выше кода позаимствована из библиотеки wxHTTPEngine, но, к сожалению, исходная реализация не работала с русскими символами и пришлось ее немного доработать напильником.
Так, с URL-encoding’ом разобрались, но это еще не все. Перед тем как формировать URL-encoded строку нам необходимо текст преобразовать в UTF-8. Для этого можно использовать метод wxString::ToUTF8().
Список поддерживаемых сервисом языков можно найти на странице описания Google Language API. У нас в программе для этого будет массив структур, каждая из которых будет содержать полное название языка и его код (который можно будет передать в параметр languagepair):

wxGoogleTranslate::wxGoogleTranslateLanguageInfo
        wxGoogleTranslate::m_LanguageInfoArray[] =
{
        {wxT("AFRIKAANS"),                            wxT("af")},
        {wxT("ALBANIAN"),                             wxT("sq")},
        {wxT("AMHARIC"),                              wxT("am")},
        {wxT("ARABIC"),                                       wxT("ar")},
        {wxT("ARMENIAN"),                             wxT("hy")},
        {wxT("AZERBAIJANI"),                  wxT("az")},
        {wxT("BASQUE"),                                       wxT("eu")},
        {wxT("BELARUSIAN"),                           wxT("be")},
        {wxT("BENGALI"),                              wxT("bn")},
        {wxT("BIHARI"),                                       wxT("bh")},
        {wxT("BULGARIAN"),                            wxT("bg")},
        {wxT("BURMESE"),                              wxT("my")},
        {wxT("CATALAN"),                              wxT("ca")},
        {wxT("CHEROKEE"),                             wxT("chr")},
        {wxT("CHINESE"),                              wxT("zh")},
        {wxT("CHINESE_SIMPLIFIED"),           wxT("zh-CN")},
        {wxT("CHINESE_TRADITIONAL"),  wxT("zh-TW")},
        {wxT("CROATIAN"),                             wxT("hr")},
        {wxT("CZECH"),                                        wxT("cs")},
        {wxT("DANISH"),                                       wxT("da")},
        {wxT("DHIVEHI"),                              wxT("dv")},
        {wxT("DUTCH"),                                        wxT("nl")},
        {wxT("ENGLISH"),                              wxT("en")},
        {wxT("ESPERANTO"),                            wxT("eo")},
        {wxT("ESTONIAN"),                             wxT("et")},
        {wxT("FILIPINO"),                             wxT("tl")},
        {wxT("FINNISH"),                              wxT("fi")},
        {wxT("FRENCH"),                                       wxT("fr")},
        {wxT("GALICIAN"),                             wxT("gl")},
        {wxT("GEORGIAN"),                             wxT("ka")},
        {wxT("GERMAN"),                                       wxT("de")},
        {wxT("GREEK"),                                        wxT("el")},
        {wxT("GUARANI"),                              wxT("gn")},
        {wxT("GUJARATI"),                             wxT("gu")},
        {wxT("HEBREW"),                                       wxT("iw")},
        {wxT("HINDI"),                                        wxT("hi")},
        {wxT("HUNGARIAN"),                            wxT("hu")},
        {wxT("ICELANDIC"),                            wxT("is")},
        {wxT("INDONESIAN"),                           wxT("id")},
        {wxT("INUKTITUT"),                            wxT("iu")},
        {wxT("ITALIAN"),                              wxT("it")},
        {wxT("JAPANESE"),                             wxT("ja")},
        {wxT("KANNADA"),                              wxT("kn")},
        {wxT("KAZAKH"),                                       wxT("kk")},
        {wxT("KHMER"),                                        wxT("km")},
        {wxT("KOREAN"),                                       wxT("ko")},
        {wxT("KURDISH"),                              wxT("ku")},
        {wxT("KYRGYZ"),                                       wxT("ky")},
        {wxT("LAOTHIAN"),                             wxT("lo")},
        {wxT("LATVIAN"),                              wxT("lv")},
        {wxT("LITHUANIAN"),                           wxT("lt")},
        {wxT("MACEDONIAN"),                           wxT("mk")},
        {wxT("MALAY"),                                        wxT("ms")},
        {wxT("MALAYALAM"),                            wxT("ml")},
        {wxT("MALTESE"),                              wxT("mt")},
        {wxT("MARATHI"),                              wxT("mr")},
        {wxT("MONGOLIAN"),                            wxT("mn")},
        {wxT("NEPALI"),                                       wxT("ne")},
        {wxT("NORWEGIAN"),                            wxT("no")},
        {wxT("ORIYA"),                                        wxT("or")},
        {wxT("PASHTO"),                                       wxT("ps")},
        {wxT("PERSIAN"),                              wxT("fa")},
        {wxT("POLISH"),                                       wxT("pl")},
        {wxT("PORTUGUESE"),                           wxT("pt-PT")},
        {wxT("PUNJABI"),                              wxT("pa")},
        {wxT("ROMANIAN"),                             wxT("ro")},
        {wxT("RUSSIAN"),                              wxT("ru")},
        {wxT("SANSKRIT"),                             wxT("sa")},
        {wxT("SERBIAN"),                              wxT("sr")},
        {wxT("SINDHI"),                                       wxT("sd")},
        {wxT("SINHALESE"),                            wxT("si")},
        {wxT("SLOVAK"),                                       wxT("sk")},
        {wxT("SLOVENIAN"),                            wxT("sl")},
        {wxT("SPANISH"),                              wxT("es")},
        {wxT("SWAHILI"),                              wxT("sw")},
        {wxT("SWEDISH"),                              wxT("sv")},
        {wxT("TAJIK"),                                        wxT("tg")},
        {wxT("TAMIL"),                                        wxT("ta")},
        {wxT("TAGALOG"),                              wxT("tl")},
        {wxT("TELUGU"),                                       wxT("te")},
        {wxT("THAI"),                                 wxT("th")},
        {wxT("TIBETAN"),                              wxT("bo")},
        {wxT("TURKISH"),                              wxT("tr")},
        {wxT("UKRAINIAN"),                            wxT("uk")},
        {wxT("URDU"),                                 wxT("ur")},
        {wxT("UZBEK"),                                        wxT("uz")},
        {wxT("UIGHUR"),                                       wxT("ug")},
        {wxT("VIETNAMESE"),                           wxT("vi")},
        {wxT("UNKNOWN"),                              wxEmptyString}
};

Для получения списка языков будет использоваться метод wxGoogleTranslate::GetLanguages()

void wxGoogleTranslate::GetLanguages(wxArrayString & result)
{
        result.Clear();
        int count = sizeof(m_LanguageInfoArray) /
                sizeof(wxGoogleTranslateLanguageInfo);
        for(int i = 0; i < count; i++)
        {
                result.Add(m_LanguageInfoArray[i].languageName);
        }
}

Для получения кода языка предназначен метод wxGoogleTranslate::GetLanguageCode():

wxString wxGoogleTranslate::GetLanguageCode(const wxString & languageName)
{
        int count = sizeof(m_LanguageInfoArray) /
                sizeof(wxGoogleTranslateLanguageInfo);
        for(int i = 0; i < count; i++)
        {
                if(m_LanguageInfoArray[i].languageName.Lower().IsSameAs(
                        languageName.Lower()))
                {
                        return m_LanguageInfoArray[i].languageCode;
                }
        }
        return wxEmptyString;
}

Теперь можно реализовывать непосредственно метод для перевода текста:

bool wxGoogleTranslate::Translate(const wxString & source,
                wxString & result,
                const wxString & sourceLanguageCode,
                const wxString & resultLanguageCode,
                wxString & translationDetails,
                int & errorCode)
{
        do
        {
                wxString urlEncodedSource =
                        URLEncode(wxString::FromAscii(source.ToUTF8()));
                wxString srcURL = wxString::Format(
                        wxT("%s?v=1.0&q=%s&langpair=%s%%7C%s"),
                        wxT("http://ajax.googleapis.com/ajax/services/language/translate"),
                        urlEncodedSource.GetData(),
                        sourceLanguageCode.GetData(),
                        resultLanguageCode.GetData());
                wxURL url = srcURL;
                if(url.GetError() != wxURL_NOERR) break;
                wxInputStream * in = url.GetInputStream();
                if(!in) break;
                wxString response;
                wxStringOutputStream out(&response);
                in->Read(out);
                wxDELETE(in);
                if(response.IsEmpty()) break;
                if(!wxGoogleTranslate::ParseJSONResponse(response, result,
                        translationDetails, errorCode)) break;
                return true;
        }
        while(false);
        return false;
}

Результат запроса приходит в формате JSON. В стандартной поставке wxWidgets библиотеки для парсинга JSON нет, зато есть сторонняя библиотека wxJSON, которую мы и будем использовать.
Формат ответа от сервиса Google Translate:

{"responseData": {"translatedText":"sometext"}, "responseDetails": "sometext", "responseStatus": 200}

Где

  • translatedText – переведенный текст
  • responseDetails – дополнительная информация от сервиса (сообщение об ошибке)
  • responseStatus – код ошибки

Метод для парсинга ответа сервиса:

bool wxGoogleTranslate::ParseJSONResponse(const wxString & response,
                wxString & translatedText,
                wxString & translateionDetails,
                int & translationStatus)
{
        do
        {
                wxJSONValue  root;
                wxJSONReader reader;
                if(reader.Parse(response, &root) > 0) break;
                translatedText =
                        root[wxT("responseData")][wxT("translatedText")].AsString();
                translateionDetails =
                        root[wxT("responseDetails")].AsString();
                translationStatus =
                        root[wxT("responseStatus")].AsInt();
                return true;
        }
        while(false);
        return false;
}

Ну вот, работу над классом переводчика закончили. Теперь посмотрим как его использовать:

void wxGoogleTranslateClientMainFrame::OnTRANSLATEClick( wxCommandEvent& event )
{
        do
        {
                wxString result;
                wxString details;
                int errorCode(0);
                int sourceLangselection = m_SourceLanguageChoice->GetSelection();
                int resultLangselection = m_ResultLanguageChoice->GetSelection();
                if((sourceLangselection < 0) || (resultLangselection < 0)) break;
                if(wxGoogleTranslate::Translate(m_SourceTextCtrl->GetValue(),
                        result,
                        wxGoogleTranslate::GetLanguageCode(
                                m_SourceLanguageChoice->GetString(sourceLangselection)),
                        wxGoogleTranslate::GetLanguageCode(
                        m_ResultLanguageChoice->GetString(resultLangselection)),
                                details, errorCode))
                {
                        m_ResultTextCtrl->SetValue(result);
                }
                else
                {
                        wxMessageBox(wxString::Format(_("Erorr occured: %s"), details.GetData()));
                }
        }
        while(false);
}

Хотелось бы отметить вот что: для загрузки ответа от сервиса используется класс wxURL. Используется синхронно, поэтому работа вызывающего потока приложения блокируется до тех пор пока загрузка не будет завершена.
Использование же класса переводчика заключается в вызове метода Translate(), никаких дополнительных действий по инициализации или деинициализации не требуется.

Исходный код библиотеки wxGoogleTranslate, а также исходный код и исполняемые файлы примера для Windows NT/2000/XP/Vista и для Windows Mobile 2003/5/6 можно загрузить здесь.

Еще интересные посты о программировании для мобильных устройств:

4 Comments

Make A Comment
  • Begemot Said:

    Вова, ты монстр!
    Я в восхищении :)

  • T-Rex Said:

    Эээ.. а чего прям так?

  • Begemot Said:

    ну все пишешь, пишешь, работаешь аки пчела :)
    Вот и я говорю, молодец.

  • Mobile Developer - Программирование для мобильных устройств» Blog Archive Said:

    [...] со всякими online-сервисами. Вон было недавно о Google Translate и Yahoo! Maps, а сегодня буду рассказывать о том как [...]

Comments RSS Feed   TrackBack URL

Leave a comment

Please leave these two fields as-is:

top