Glossário Geek: URL, WWW e TLD

Por Redação com POP 21/12/2014 13h01
Por Redação com POP 21/12/2014 13h01
Glossário Geek: URL, WWW e TLD
Foto: Reprodução
Você deve estar se perguntando o que são essas letrinhas, mas logo tudo fará sentido: no glossário de hoje, vamos aprender o que são e como funcionam algumas peças-chave da Internet:
URL

“Uniform Resource Locator” (“URL”) ou, popularmente, “endereço web” é, como o nome sugere, uma série de caracteres específicos que geram uma referência para um elemento disponibilizado na Web. Basicamente, imagine que o URL é o endereço de sua casa. Ele precisa ser exato, já que a “Rua dos Bobos, número 0”, não é a mesma coisa que a “Rua dos Bobós, número 10”.

Às vezes, uma letra de diferença pode levar a um outro conteúdo, ou ainda a um erro de “Não Encontrado” que pode ser igualmente frustrante. No pior dos casos, há a chance de phishing e até invasão por Malware – vários criminosos já se aproveitaram de erros frequentes na digitação de links para levar usuários a páginas “clonadas” que acabam por roubar dados ou disponibilizar downloads mal-intencionados.

O formato nasceu em 1994 pelas mãos de Tim Berners-Lee, parte da Internet Engineering Task Force (IETF), que combinou formatos já utilizados para criar uma padronização que perdura até os dias de hoje. Cada URL conta com um protocolo (geralmente, mas não obrigatoriamente, http, seguido por “://”), depois um nome de servidor (que pode ser “www”, depois um “.”), um domínio e, por fim um domínio de topo.

Em outras palavras, chegamos a um endereço como “http://www.pop.com.br/”. Em alguns casos, também podemos contar com subdomínios no lugar do simples “www”, como http://likeanerd.pop.com.br/. Outras alternativas podem surgir, mas para o usuário médio é esse o formato. Depois do domínio de topo, você pode ter notado uma barra: isso ocorre porque o conteúdo é organizado a partir de um sistema de pastas em um servidor, assim como os arquivos no seu computador. Na prática, tudo que vier depois de uma “/” é uma pasta ou arquivo. Se não houver nada depois, isso significa que estamos na raiz do site.

Vale ressaltar que em não vale tudo na hora de fazer um URL: Alguns caracteres não são suportados e acabam sendo codificados. Outros, acabam sendo exclusivos para alguns tipos de processos e podem até surgir, mas não como parte principal do endereço. É por isso que não temos acentuação e símbolos como #, ! e ? tem usos muito específicos.
WWW (World Wide Web)

Você sabe qual a diferença da Internet para a World Wide Web? Se você acha que esta frase não fez sentido, acredite – a Web e a Internet não são a mesma coisa.

A “World Wide Web”, também conhecida como WWW, W3, “Rede Mundial”, “Rede” e “Web”, entre tantos outros nomes que só servem para confundir os usuários e a mídia, não é a mesma coisa que a Internet!

Apesar dos termos serem usados quase sempre sem distinção, eles são correlatos, mas diferentes: Imagine que você tem um grande computador, onde funcionam diversos programas. A Internet é esse computador, e a Web é um dos programas. A grande confusão aqui fica no fato de que a Internet é um sistema global de redes de computadores interconectadas, enquanto a Web é um coletivo de arquivos, geralmente acessíveis exclusivamente por Navegadores ou, em inglês, “Web Browsers” (entendeu o por quê do nome, agora?), a partir do conteúdo disponibilizado em servidores (ou “Web Servers”).

Esse princípio de funcionamento é derivado de modelos do início da Internet, mas foi só na proposta de Tim Berners-Lee e Robert Cailliau, de 1990, que o nome “WorldWideWeb” (sem espaços, na época) surgiu, propondo uma “rede” de “documentos de hipertexto”, utilizando navegadores, em que um usuário pudesse acessar informações a vontade. Os anos seguinte viram um crescimento do interesse, primeiramente acadêmico, depois aberto ao público geral quando o escopo do projeto era grande demais para os laboratórios, culminando na Web que conhecemos. No meio do caminho, em 1994, Berners-Lee fundou a World Wide Web Consortium (W3C), que até hoje é responsável pela manutenção de padrões da Web.

Acessar um site na Web hoje é simples – utilizando um navegador, digitamos um URL (endereço de página) ou clicamos em um link. Esse endereço gera uma comunicação entre o sistema cliente, pelo navegador, e o servidor de conteúdo, demonstrando o resultado. Antigamente, era padrão que todos os sites começassem com o prefixo “www”, mas você pode ter notado que a prática cada vez mais cai em desuso. É isso aí: como você pode ter notado por sites como o Twitter ou Facebook, assim como pode estar vendo pelo endereço desta página, não é necessário ter um “www” para se estar na Web.

Na prática, tudo começou com um engano. Aparentemente, o uso se popularizou graças à uma das páginas da CERN (“European Organization for Nuclear Research”, ou “Organização Européia para Pesquisas Nucleares”), pioneira da internet, que planejou o uso do subdomínio “www.cern.ch” para falar sobre o projeto da Web e “info.cern.ch” como seu site institucional. Os domínios acabaram trocados e a reversão nunca foi feita, criando-se a partir daí o “padrão” do “www” para sites de instituições. Não existe qualquer documentação ou padrão que obrigue o uso das três letrinhas, mas isso não impediu que praticamente todos as utilizassem.

Isso levou a uma série de decisões e adaptações interessantes, como sites “duplicados”, com domínios com e sem “www”, assim como tecnologias inteligentes em navegadores que, pela ausência e presente inconstante desse início, já são programados para tentar variações, se não conseguirem a conexão.
TLD (Top-Level Domain)

Sempre que você digita o endereço de um site, ele tem uma terminação, geralmente “.com”, “.net”, “.org” ou, claro, “.com.br”. Chamados de Top-Level Domain ou TLD (ou “Domínio de Topo”), como a nomenclatura sugere, estes seriam os domínios (série de identificação que define um espaço administrativo na Internet) no topo da hierarquia do Sistema de Nomenclatura de Sistemas (Domain Name System ou DNS) na Internet.

Basicamente, resumindo dentro do mundo que conhecemos e convivemos, é a parte final do nome de um domínio, de uma URL. Nesta página, por exemplo, seria “.com.br”, como de muitos outros sites brasileiros.

Essas terminações, que são por regra isentas de diferenciação de letra maiúscula ou minúscula (tanto faz .COM.BR, .com.BR, .COM.br ou .com.br – o sistema não diferencia), são no geral definidas e gerenciadas pela ICANN (“Internet Corporation for Assigned Names and Numbers”, ou “Corporação da Internet para Designação de Nomes e Números”).

Historicamente, as divisões e detalhes variaram, mas hoje existem quatro tipos principais de TLDs:

1- Domínios de topo genéricos (“Generic Top-Level Domains”, ou gTLD): Domínios que designam espaços genéricos da Internet. Aqui entra, claro, o “.com” (na prática organizações comerciais, mas não necessariamente), “.edu” (educacionais), “.gov” (governamentais), “.org” (originalmente para organizações, mas hoje sem restrições), entre vários outros, incluindo possibilidades de gTLDs patrocinados (“Sponsored Top-Level domains”, ou sTLDs).

2- Domínios de topo de código de país (“Country-code Top-Level Domains”, ou ccTLD): Definidos pelo código ISO 3166-1 alpha-2, são códigos de 2 letras estabelecidos para designar países e territórios, como por exemplo o nosso “.br”. (Lista completa disponível AQUI)

3- Domínios de topo internacionalizados (“Internationalized Top-Level Domains”, ou IDN): Se dividem em “domínios de topo de código de país internacionalizado” (“Internationalized country code top-level domains”, ou IDN ccTLD), que são ccTLD com caracteres não-latinos, e “Domínios de topo em teste” (“Testing top-level domains”), auto-explicativos.

4- Domínios de topo de infraestruturas (“Infrastructure Top-Level Domains”): Um único domínio faz parte deste grupo, o ARPA (“Address and Routing Parameter Area”, ou “Área de Parâmetros de Endereçamento e Roteamento”), usado exclusivamente para funcionalidades de infraestrutura.

Conforme navegamos, notamos várias combinações possíveis, sendo que é possível ter um domínio de internet com vários TLDs diferentes, seja para sites de mesmo nome ou para diferentes nacionalidades do mesmo endereço. Historicamente, houveram sites de Phishing que já tentaram se passar por outros famosos, utilizando domínios com TLDs diversos. Hoje é muito mais difícil, já que existem mais cuidados neste respeito, mas atenção nunca é demais.