Função file_get_contents retornando http code 403 – “403 Forbidden” ou “Acesso negado”.
Tutorial de como contornar a resposta de um servidor web “403 Forbidden” quando utilizamos a função file_get_contents para fazer um requisição a uma URL externa.
Definindo um User Agent
Provavelmente o servidor aonde está rodando o site que você está tentando acessar esta bloqueando seu acesso pela falta de um User Agent.
Na web o User-Agent é um conjunto de dados utilizados pelos navegadores, ele é enviado no header de uma requisição HTTP com o objetivo de informar para o servidor de destino as informações sobre o navegador, versão, etc.
Coloque este código antes de chamar a função file_get_contents:
ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 6.0)'); $conteudo = file_get_contents("http://exemplo.com");
Acesse o site UserAgentString.com com a uma lista de vários User Agents que você pode estar utilizando.
Uma outra opção é utilizar está função para gerar User Agents randômicos:
function returnRandomUserAgent() { $aBrowser = array('Firefox', 'Safari', 'Opera', 'Flock', 'Internet Explorer', 'Seamonkey', 'Tor Browser', 'GNU IceCat', 'CriOS', 'TenFourFox', 'SeaMonkey', 'B-l-i-t-z-B-O-T', 'Konqueror', 'Mobile', 'Konqueror', 'Netscape', 'Chrome', 'Dragon', 'SeaMonkey', 'Maxthon', 'IBrowse' ); $aSystem = array('Windows 3.1', 'Windows 95', 'Windows 98', 'Windows 2000', 'Windows NT', 'Linux 2.4.22-10mdk', 'FreeBSD', 'Windows XP', 'Windows Vista', 'Redhat Linux', 'Ubuntu', 'Fedora', 'AmigaOS', 'BackTrack Linux', 'iPad', 'BlackBerry', 'Unix', 'CentOS Linux', 'Debian Linux', 'Macintosh', 'Android', 'iPhone', 'Windows NT 6.1', 'BeOS', 'OS 10.5', 'Nokia', 'Arch Linux', 'Ark Linux', 'BitLinux', 'Conectiva (Mandriva)', 'CRUX Linux', 'Damn Small Linux', 'DeLi Linux', 'Ubuntu', 'BigLinux', 'Edubuntu' ); $locals = array('cs-CZ', 'en-US', 'sk-SK', 'pt-BR', 'sq_AL', 'sq', 'ar_DZ', 'ar_BH', 'ar_EG', 'ar_IQ', 'ar_JO', 'ar_KW', 'ar_LB', 'ar_LY', 'ar_MA', 'ar_OM', 'ar_QA', 'ar_SA', 'ar_SD', 'ar_SY', 'ar_TN', 'ar_AE', 'ar_YE', 'ar', 'be_BY', 'be', 'bg_BG', 'bg', 'ca_ES', 'ca', 'zh_CN', 'zh_HK', 'zh_SG', 'zh_TW', 'zh', 'hr_HR', 'hr', 'cs_CZ', 'cs', 'da_DK', 'da', 'nl_BE', 'nl_NL', 'nl', 'en_AU', 'en_CA', 'en_IN', 'en_IE', 'en_MT', 'en_NZ', 'en_PH', 'en_SG', 'en_ZA', 'en_GB', 'en_US', 'en', 'et_EE', 'et', 'fi_FI', 'fi', 'fr_BE', 'fr_CA', 'fr_FR', 'fr_LU', 'fr_CH', 'fr', 'de_AT', 'de_DE' ); return $aBrowser[rand(0, count($aBrowser) - 1)] . '/' . rand(1, 20) . '.' . rand(0, 20) . ' (' . $aSystem[rand(0, count($aSystem) - 1)] . ' ' . rand(1, 7) . '.' . rand(0, 9) . '; ' . $locals[rand(0, count($locals) - 1)] . ';)'; }
Conclusão e observações
Um teste a ser feito para validar se o bloqueio está ocorrendo pela falta do User-Agent é acessando a URL diretamente pelo browser, se a página carregar corretamente com http code response 200, então a solução acima deverá funcionar.
É importante você se certificar-se que no servidor de destino não está sendo bloqueado o seu IP, acaso isso ocorra a solução acima não irá funcionar.
Uma outra opção, além do UserAgent é adicionar alguns cookies na requisição que são gerados dentro do site de destino ou até mesmo utilizar a biblioteca curl para fazer a requisição juntamente com um proxy.
Bom desenvolvimento 😉

