Экранирование URL в Python
Экранирование URL позволяет заменять пробелы и русские символы на последовательность символов %XX
, где XX
обозначает код символа.
Например, пробел будет заменен на %20
.
Такой подход позволяет осуществлять взаимодействие сервераов и клиентов, не поддерживающих полный алфавит символов.
Экранирование URL можно произвести с помощью функций urllib2.quote()
и urllib2.unquote()
. Пример их использования приведен ниже.
>>> import urllib2
>>> print urllib2.quote('test.org/Русский текст')
test.org/%D0%A0%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9%20%D1%82%D0%B5%D0%BA%D1%81%D1%82
>>> print urllib2.unquote('test.org/%D0%A0%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9%20%D1%82%D0%B5%D0%BA%D1%81%D1%82')
test.org/Русский текст