Tim Macfarlane 的 answer 在使用 HTTP 代理方面非常接近。
使用 HTTP 代理(用于非安全请求)非常简单。您连接到代理并正常发出请求,除了路径部分包含完整的 url 并且主机标头设置为您要连接的主机。蒂姆非常接近他的答案,但他错过了正确设置主机标题。
var http = require("http");
var options = {
host: "proxy",
port: 8080,
path: "http://www.google.com",
headers: {
Host: "www.google.com"
}
};
http.get(options, function(res) {
console.log(res);
res.pipe(process.stdout);
});
作为记录,他的答案确实适用于 http://nodejs.org/ 但那是因为他们的服务器不关心主机标头不正确。
编辑:截至 2020 年 2 月 11 日,请求已完全弃用。预计不会有新的变化。
您可以使用 request,我只是发现在 node.js 上使用代理非常容易,只需一个外部“代理”参数,它还通过 http 代理支持 HTTPS。
var request = require('request');
request({
'url':'https://anysite.you.want/sub/sub',
'method': "GET",
'proxy':'http://yourproxy:8087'
},function (error, response, body) {
if (!error && response.statusCode == 200) {
console.log(body);
}
})
http
和 https
工作,非常感谢
headers: {'Proxy-Authorization': XXXX}
我花了一段时间才弄清楚的一件事是,使用“http”访问代理,即使您试图通过代理访问 https 服务器。这适用于我使用 Charles(osx 协议分析器):
var http = require('http');
http.get ({
host: '127.0.0.1',
port: 8888,
path: 'https://www.google.com/accounts/OAuthGetRequestToken'
}, function (response) {
console.log (response);
});
我购买了私人代理服务器,购买后我得到:
255.255.255.255 // IP address of proxy server
99999 // port of proxy server
username // authentication username of proxy server
password // authentication password of proxy server
我想使用它。 First answer 和 second answer 仅适用于 http(proxy) -> http(destination),但是我想要 http(proxy) -> https(目的地)。
对于 https 目标,最好直接使用 HTTP tunnel。我找到了解决方案 here。
节点 v8:
const http = require('http')
const https = require('https')
const username = 'username'
const password = 'password'
const auth = 'Basic ' + Buffer.from(username + ':' + password).toString('base64')
http.request({
host: '255.255.255.255', // IP address of proxy server
port: 99999, // port of proxy server
method: 'CONNECT',
path: 'kinopoisk.ru:443', // some destination, add 443 port for https!
headers: {
'Proxy-Authorization': auth
},
}).on('connect', (res, socket) => {
if (res.statusCode === 200) { // connected to proxy server
https.get({
host: 'www.kinopoisk.ru',
socket: socket, // using a tunnel
agent: false, // cannot use a default agent
path: '/your/url' // specify path to get from server
}, (res) => {
let chunks = []
res.on('data', chunk => chunks.push(chunk))
res.on('end', () => {
console.log('DONE', Buffer.concat(chunks).toString('utf8'))
})
})
}
}).on('error', (err) => {
console.error('error', err)
}).end()
节点 v14:
const http = require('http');
const https = require('https');
const username = 'username';
const password = 'password';
const auth = 'Basic ' + Buffer.from(username + ':' + password).toString('base64');
http.request({
host: '255.255.255.255', // IP address of proxy server
port: 99999, // port of proxy server
method: 'CONNECT',
path: 'kinopoisk.ru:443', // some destination, add 443 port for https!
headers: {
'Proxy-Authorization': auth
},
}).on('connect', (res, socket) => {
if (res.statusCode === 200) { // connected to proxy server
const agent = new https.Agent({ socket });
https.get({
host: 'www.kinopoisk.ru',
path: '/',
agent, // cannot use a default agent
}, (res) => {
let chunks = []
res.on('data', chunk => chunks.push(chunk))
res.on('end', () => {
console.log('DONE', Buffer.concat(chunks).toString('utf8'))
})
})
}
}).on('error', (err) => {
console.error('error', err)
}).end();
socket
属性未记录在 nodejs 中。是否删除了此选项。
http
模块的 get
/ request
函数不支持 socket
选项,只会被忽略。
正如@Renat 这里已经提到的,代理的 HTTP 流量来自非常正常的 HTTP 请求。向代理发出请求,将目标的完整 URL 作为路径传递。
var http = require ('http');
http.get ({
host: 'my.proxy.com',
port: 8080,
path: 'http://nodejs.org/'
}, function (response) {
console.log (response);
});
以为我会添加我发现的这个模块:https://www.npmjs.org/package/global-tunnel,这对我很有用(立即使用我的所有代码和第三方模块,只有下面的代码)。
require('global-tunnel').initialize({
host: '10.0.0.10',
port: 8080
});
这样做一次,您的应用程序中的所有 http(和 https)都会通过代理。
或者,调用
require('global-tunnel').initialize();
将使用 http_proxy
环境变量
'request' http 包似乎有这个功能:
https://github.com/mikeal/request
例如,下面的 'r' 请求对象使用 localproxy 来访问其请求:
var r = request.defaults({'proxy':'http://localproxy.com'})
http.createServer(function (req, resp) {
if (req.url === '/doodle.png') {
r.get('http://google.com/doodle.png').pipe(resp)
}
})
不幸的是,没有“全局”默认值,因此使用它的库的用户无法修改代理,除非该库通过 http 选项...
HTH,克里斯
如果您需要为您的代理提供商使用基本授权,只需使用以下内容:
var http = require("http");
var options = {
host: FarmerAdapter.PROXY_HOST,
port: FarmerAdapter.PROXY_PORT,
path: requestedUrl,
headers: {
'Proxy-Authorization': 'Basic ' + new Buffer(FarmerAdapter.PROXY_USER + ':' + FarmerAdapter.PROXY_PASS).toString('base64')
}
};
var request = http.request(options, function(response) {
var chunks = [];
response.on('data', function(chunk) {
chunks.push(chunk);
});
response.on('end', function() {
console.log('Response', Buffer.concat(chunks).toString());
});
});
request.on('error', function(error) {
console.log(error.message);
});
request.end();
基本上你不需要明确的代理支持。代理协议非常简单,基于普通的 HTTP 协议。与 HTTPClient 连接时,您只需要使用您的代理主机和端口。示例(来自 node.js 文档):
var http = require('http');
var google = http.createClient(3128, 'your.proxy.host');
var request = google.request('GET', '/',
{'host': 'www.google.com'});
request.end();
...
所以基本上你连接到你的代理但向“http://www.google.com”发出请求。
Node 应该支持使用 http_proxy 环境变量——所以它是跨平台的并且可以在系统设置上工作,而不是需要每个应用程序的配置。
使用提供的解决方案,我会推荐以下内容:
咖啡脚本
get_url = (url, response) ->
if process.env.http_proxy?
match = process.env.http_proxy.match /^(http:\/\/)?([^:\/]+)(:([0-9]+))?/i
if match
http.get { host: match[2], port: (if match[4]? then match[4] else 80), path: url }, response
return
http.get url, response
Javascript
get_url = function(url, response) {
var match;
if (process.env.http_proxy != null) {
match = process.env.http_proxy.match(/^(http:\/\/)?([^:\/]+)(:([0-9]+))?/i);
if (match) {
http.get({
host: match[2],
port: (match[4] != null ? match[4] : 80),
path: url
}, response);
return;
}
}
return http.get(url, response);
};
用法 要使用该方法,只需替换 http.get 即可,例如以下将 google 的索引页面写入名为 test.htm 的文件:
file = fs.createWriteStream path.resolve(__dirname, "test.htm")
get_url "http://www.google.com.au/", (response) ->
response.pipe file
response.on "end", ->
console.log "complete"
我认为截至 2019 年的答案有更好的替代方案。我们可以使用 global-tunnel-ng
包来初始化代理,而不会到处污染基于 http
或 https
的代码。所以首先安装 global-tunnel-ng
包:
npm install global-tunnel-ng
然后根据需要更改您的实现以初始化代理:
const globalTunnel = require('global-tunnel-ng');
globalTunnel.initialize({
host: 'proxy.host.name.or.ip',
port: 8080
});
Imskull 的回答几乎对我有用,但我不得不做出一些改变。唯一真正的变化是添加用户名、密码,并将rejectUnauthorized 设置为false。我无法发表评论,所以我将其放入答案中。
如果您运行代码,它将为您提供 Hacker News 上当前故事的标题,按照本教程:http://smalljs.org/package-managers/npm/
var cheerio = require('cheerio');
var request = require('request');
request({
'url': 'https://news.ycombinator.com/',
'proxy': 'http://Username:Password@YourProxy:Port/',
'rejectUnauthorized': false
}, function(error, response, body) {
if (!error && response.statusCode == 200) {
if (response.body) {
var $ = cheerio.load(response.body);
$('td.title a').each(function() {
console.log($(this).text());
});
}
} else {
console.log('Error or status not equal 200.');
}
});
只需使用像 tsocks tsocks node myscript.js
这样的代理包装器运行 nodejs
原始解决方案:Doing http requests through a SOCKS5 proxy in NodeJS
更多信息:https://www.binarytides.com/proxify-applications-with-tsocks-and-proxychains-on-ubuntu/
对于窗口:https://superuser.com/questions/319516/how-to-force-any-program-to-use-socks
可能不是您所希望的确切单行,但您可以查看 http://github.com/nodejitsu/node-http-proxy,因为这可能会阐明如何将您的应用程序与 http.Client 一起使用。
根据该线程的回答,您似乎可以使用 proxychains 通过代理服务器运行 node.js:
$ proxychains /path/to/node application.js
就个人而言,我无法在 Cygwin/Windows 环境中安装任何代理链版本,因此无法对其进行测试。
此外,他们还谈到了使用连接代理,但我找不到任何关于如何做到这一点的文档。
简而言之,我仍然陷入困境,但也许有人可以使用此信息找到合适的解决方法。
像这样使用“https-proxy-agent”
var HttpsProxyAgent = require('https-proxy-agent');
var proxy = process.env.https_proxy || 'other proxy address';
var agent = new HttpsProxyAgent(proxy);
options = {
//...
agent : agent
}
https.get(options, (res)=>{...});
如果您有 Basic http authentication scheme,则必须创建一个 myuser:mypassword
的 base64 字符串,然后在开头添加“Basic”。这是 Proxy-Authorization 标头的值,这里是一个示例:
var Http = require('http');
var req = Http.request({
host: 'myproxy.com.zx',
port: 8080,
headers:{"Proxy-Authorization": "Basic bXl1c2VyOm15cGFzc3dvcmQ="},
method: 'GET',
path: 'http://www.google.com/'
}, function (res) {
res.on('data', function (data) {
console.log(data.toString());
});
});
req.end();
在 nodejs 中,您可以使用 Buffer 进行编码
var encodedData = Buffer.from('myuser:mypassword').toString('base64');
console.log(encodedData);
例如,在浏览器中,您可以使用 btoa() 在 base64 中进行编码,这在没有代理设置的浏览器中使用代理执行请求时非常有用。
var encodedData = btoa('myuser:mypassword') console.log(encodedData);
如何找到接受代理服务器的方案?
如果我们没有配置自定义 DNS(会抛出类似 ERR_NAME_NOT_RESOLVED 的东西),当我们执行请求时,响应(代码 407)应该在响应标头中告知代理正在使用哪种 http 身份验证方案。
不定期副业成功案例分享
404
,而目的地服务器永远不会收到请求..