<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>THLopes.com &#187; unicode</title>
	<atom:link href="http://www.thlopes.com/tag/unicode/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.thlopes.com</link>
	<description>Web, Ciência, Computação e Poesia</description>
	<lastBuildDate>Mon, 02 Jan 2012 20:29:16 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Vida longa ao Unicode!</title>
		<link>http://www.thlopes.com/2010/02/vida-longa-ao-unicode/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=vida-longa-ao-unicode</link>
		<comments>http://www.thlopes.com/2010/02/vida-longa-ao-unicode/#comments</comments>
		<pubDate>Mon, 01 Feb 2010 23:07:36 +0000</pubDate>
		<dc:creator>Thomas Lopes</dc:creator>
				<category><![CDATA[Fatos]]></category>
		<category><![CDATA[web]]></category>
		<category><![CDATA[Encoding]]></category>
		<category><![CDATA[unicode]]></category>

		<guid isPermaLink="false">http://www.thlopes.com/?p=661</guid>
		<description><![CDATA[A luta pela padronização na Web comemora mais um grade fato: o Unicode (se você não reconhece esse termo, que tal UTF-8?) reina quando o assunto é o encoding utilizado pelas páginas (pelo menos as encontráveis pelo Google). Confira uma parte do post feito por Augusto Campos no blog BR-Linux.org: <a href="http://www.thlopes.com/2010/02/vida-longa-ao-unicode/">Continuar lendo <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>A luta pela padronização na Web comemora mais um grade fato: o <a title="Verbete unicode na Wikipedia, pt" href="http://pt.wikipedia.org/wiki/Unicode">Unicode </a>(se você não reconhece esse termo, que tal <a title="Verbete UTF-8 Na wikipedia, pt" href="http://pt.wikipedia.org/wiki/UTF-8">UTF-8</a>?) reina quando o assunto é o encoding utilizado pelas páginas (pelo menos as encontráveis pelo Google). Confira uma parte do <a title="Leia mais sobre Unicode na Web, no BR-Linux.org" href="http://br-linux.org/2010/unicode-dominando-a-web/">post feito por Augusto Campos no blog BR-Linux.org</a>:</p>
<p><a class="flickr-image alignleft" title="Unicode é o mais usado na Web" href="http://www.flickr.com/photos/thlopes/4323742008/"><img class="alignleft" src="http://farm5.static.flickr.com/4046/4323742008_8037bb11d7_o.png" alt="Unicode é o mais usado na Web" /></a></p>
<blockquote><p>E esta maioria está a poucos passos de galgar um degrau a mais: tornar-se superior à soma de todas as demais opções – ao menos no que diz respeito ao conjunto dos sites indexados pelo Google.</p>
<p>Consta que o Google vai promover uma festa quando a marca de 50% for ultrapassada. E como a tendência está bem clara no gráfico, não deve demorar. (<em>via <a href="http://www.h-online.com/open/news/item/Unicode-dominates-web-918063.html" target="_blank">h-online.com</a></em>)</p></blockquote>
<p>Bom, se houver mesmo uma festa, eu gostaria de ir, mas&#8230; será que essa festa será uma festa normal?!?!?</p>
<p>De qualquer forma, é um acontecimento que devemos comemorar (profissionais da web), pois é um grande avanço rumo a um trabalho melhor, menos dependente de monopólios, mais colaborativa ainda! Como muitos leitores já sabem, <a title="Post sobre Python e Unicode" href="http://old.thlopes.com/content/view/97/46/">quando se trabalha com dados oriundos da Web</a>, já é uma briga conseguir extrair tudo num formato decente para seu banco de dados. Quando ainda temos que lidar com vários conjuntos de caracteres diferentes, quando é tão simples usar um único conjunto. Recomendo, caso você trabalhe com Python, a biblioteca <a title="Uma library para parsear HTML/XML em Python" href="http://www.crummy.com/software/BeautifulSoup/">BeautifulSoup</a>, que fará a maior parte do esforço para você lidar com aquelas páginas que insistem em não usar o Unicode. Aliás, segue aqui um ótimo artigo para quem quer falar a mesma língua com a maioria do mundo: <a href="http://www.python.org.br/wiki/TudoSobrePythoneUnicode">Tudo sobre Python e Unicode</a></p>
<p><em>Cheers!</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.thlopes.com/2010/02/vida-longa-ao-unicode/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

