file_get_contents retornando http code 403 – “403 Forbidden”

Função file_get_contents retornando http code 403 – “403 Forbidden” ou “Acesso negado”.

Tutorial de como contornar a resposta de um servidor  “403 Forbidden” quando utilizamos a função file_get_contents para fazer um requisição a uma URL externa.

função php file_get_contents retornando http code 403

Definindo um User Agent

Provavelmente o servidor aonde está rodando o site que você está tentando acessar esta bloqueando seu acesso pela falta de um User Agent.

Na web o User-Agent é um conjunto de dados utilizados pelos navegadores, ele é enviado no header de uma requisição HTTP com o objetivo de informar para o servidor de destino as informações sobre o navegador, versão, etc.

Coloque este código antes de chamar a função file_get_contents:

ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 6.0)');

$conteudo = file_get_contents("http://exemplo.com");

Acesse o site UserAgentString.com com a uma lista de vários User Agents que você pode estar utilizando.

Uma outra opção é utilizar está função para gerar User Agents randômicos:

function returnRandomUserAgent() {

    $aBrowser = array('Firefox', 'Safari', 'Opera', 'Flock', 'Internet Explorer', 'Seamonkey', 'Tor Browser', 'GNU IceCat', 'CriOS', 'TenFourFox',
        'SeaMonkey', 'B-l-i-t-z-B-O-T', 'Konqueror', 'Mobile', 'Konqueror', 'Netscape', 'Chrome', 'Dragon', 'SeaMonkey', 'Maxthon', 'IBrowse'
    );

    $aSystem = array('Windows 3.1', 'Windows 95', 'Windows 98', 'Windows 2000', 'Windows NT', 'Linux 2.4.22-10mdk', 'FreeBSD',
        'Windows XP', 'Windows Vista', 'Redhat Linux', 'Ubuntu', 'Fedora', 'AmigaOS', 'BackTrack Linux', 'iPad', 'BlackBerry', 'Unix',
        'CentOS Linux', 'Debian Linux', 'Macintosh', 'Android', 'iPhone', 'Windows NT 6.1', 'BeOS', 'OS 10.5', 'Nokia', 'Arch Linux',
        'Ark Linux', 'BitLinux', 'Conectiva (Mandriva)', 'CRUX Linux', 'Damn Small Linux', 'DeLi Linux', 'Ubuntu', 'BigLinux', 'Edubuntu'
    );

    $locals = array('cs-CZ', 'en-US', 'sk-SK', 'pt-BR', 'sq_AL', 'sq', 'ar_DZ', 'ar_BH', 'ar_EG', 'ar_IQ', 'ar_JO',
        'ar_KW', 'ar_LB', 'ar_LY', 'ar_MA', 'ar_OM', 'ar_QA', 'ar_SA', 'ar_SD', 'ar_SY', 'ar_TN', 'ar_AE', 'ar_YE', 'ar',
        'be_BY', 'be', 'bg_BG', 'bg', 'ca_ES', 'ca', 'zh_CN', 'zh_HK', 'zh_SG', 'zh_TW', 'zh', 'hr_HR', 'hr', 'cs_CZ', 'cs',
        'da_DK', 'da', 'nl_BE', 'nl_NL', 'nl', 'en_AU', 'en_CA', 'en_IN', 'en_IE', 'en_MT', 'en_NZ', 'en_PH', 'en_SG', 'en_ZA',
        'en_GB', 'en_US', 'en', 'et_EE', 'et', 'fi_FI', 'fi', 'fr_BE', 'fr_CA', 'fr_FR', 'fr_LU', 'fr_CH', 'fr', 'de_AT', 'de_DE'
    );
    return $aBrowser[rand(0, count($aBrowser) - 1)] . '/' . rand(1, 20) . '.' . rand(0, 20) . ' (' . $aSystem[rand(0, count($aSystem) - 1)] . ' ' . rand(1, 7) . '.' . rand(0, 9) . '; ' . $locals[rand(0, count($locals) - 1)] . ';)';
}

Conclusão e observações

Um teste a ser feito para validar se o está ocorrendo pela falta do User-Agent é acessando a URL diretamente pelo browser, se a página carregar corretamente com http code response 200, então a solução acima deverá funcionar.

É importante você se certificar-se que no servidor de destino não está sendo bloqueado o seu IP, acaso isso ocorra a solução acima não irá funcionar.

Uma outra opção, além do UserAgent é adicionar alguns na requisição que são gerados dentro do site de destino ou até mesmo utilizar a biblioteca  para fazer a requisição juntamente com um proxy.

Bom desenvolvimento 😉

Resumo
File_get_contents retornando http code 403
Nome do Artigo
File_get_contents retornando http code 403
Descrição
Função file_get_contents retornando http code 403, "403 Forbidden" ou acesso negado, esta resposta ocorre normalmente pela falta do UserAgent na requisição
Autor
Editor
Roger Mauricio Takemiya
Logo do Editor

Dúvidas? Faça um comentário logo abaixo ou envie uma mensagem clicando aqui.

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *