现在大家都为选择专业而头痛,土木、机械、生物都是各种劝退,计算机专业依然是热门之一,那么国内的大学计算机专业的排名情况如何呢?通过爬虫软件,采集分析相关网站:
QS(CS)2020版本:https://www.topuniversities.com/university-rankings/university-subject-rankings/2020/computer-science-information-systems
USNEWS2020版本:https://www.usnews.com/education/best-global-universities/search?country=china®ion=asia&subject=computer-science
CSRankings更新
ARWU 2020版本:http://www.shanghairanking.com/Shanghairanking-Subject-Rankings/computer-science-engineering.html
ESI 2020年1月的这个:http://blog.sciencenet.cn/blog-2724438-1214545.html
进行综合分析之后,可以得出如下结论:
前十:清华、北大、上交、浙大、中科大、哈工大、华科、北航、南大。
11-20为:北邮、电子科大、西安交大、西电、东南大学、武大、中山大学、北理、大连理工、同济
如果对某特定学校感兴趣,还可以将该学校的关键词作为爬虫的词库进行采集综合分析优势,根据下面的代码进行修改即可:
import java.io.IOException;
import java.net.Authenticator;
import java.net.InetSocketAddress;
import java.net.PasswordAuthentication;
import java.net.Proxy;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class Demo
{
// 代理验证信息
final static String ProxyUser = "username";
final static String ProxyPass = "password";
// 代理服务器(产品官网 www.16yun.cn)
final static String ProxyHost = "t.16yun.cn";
final static Integer ProxyPort = 31111;
// 设置IP切换头
final static String ProxyHeadKey = "Proxy-Tunnel";
public static String getUrlProxyContent(String url)
{
Authenticator.setDefault(new Authenticator() {
public PasswordAuthentication getPasswordAuthentication()
{
return new PasswordAuthentication(ProxyUser, ProxyPass.toCharArray());
}
});
// 设置Proxy-Tunnel
Random random = new Random();
int tunnel = random.nextInt(10000);
String ProxyHeadVal = String.valueOf(tunnel);
Proxy proxy = new Proxy(Proxy.Type.HTTP, new InetSocketAddress(ProxyHost, ProxyPort));
try
{
// 处理异常、其他参数
Document doc = Jsoup.connect(url).timeout(3000).header(ProxyHeadKey, ProxyHeadVal).proxy(proxy).get();
if(doc != null) {
System.out.println(doc.body().html());
}
}
catch (IOException e)
{
e.printStackTrace();
}
return null;
}
public static void main(String[] args) throws Exception
{
// 要访问的目标页面
String targetUrl = "http://www.sysu.edu.cn/cn/index.htm";
getUrlProxyContent(targetUrl);
}
}
上一篇