首页 文章 精选 留言 我的

精选列表

搜索[镜像无法拉取],共10000篇文章
优秀的个人博客,低调大师

Python 爬张国荣最火的 8 首歌,60000 评论看完泪奔!

今天是4月1日。 每年的这一天, 一部分人搜索枯肠想尽办法整蛊, 一部分人感怀四月该很好,倘若你还在。 甚至有人,用AI的方式来还原你。 但那终究不是你啊。 你走了16年了,那些当年在课桌前趁老师不注意偷偷听你歌的少年们,或许早已为人夫为人妇。 即便如此,每年却有很多人在这人间四月天里,借着你给世界留下的不绝回音,去思念你、去给你留言,即便明明知道,永远也不会收到回复。 今天,CSDN选择以科技的方式,来纪念哥哥。 我们爬取了你在网易云音乐上,评论最多的八首歌曲。 它们依次是:《沉默是金》《春夏秋冬》《倩女幽魂》《当爱已成往事》《我》《风继续吹》《玻璃之情》《风再起时》。 总共64540条的评论中,出现最多的是“生日快乐”、“哥哥”、“加油”、“你若尚在场”、“新年快乐”和“哥哥,生日快乐”。 词云图里很少有“4月1日”、“愚人节”的字眼,这并不是今天去给你评论的人少,而是今天这个日子,实在不适合对你说“快乐”。 来,先给大家看看评论的代码。 # coding:utf-8 import json import time import requests from fake_useragent import UserAgent import random import multiprocessing import sys #reload(sys) #sys.setdefaultencoding('utf-8') ua = UserAgent(verify_ssl=False) song_list = [{'186453':'春夏秋冬'},{'188204':'沉默是金'},{'188175':'倩女幽魂'},{'188489':'风继续吹'},{'187374':'我'},{'186760':'风雨起时'}] headers = { 'Origin':'https://music.163.com', 'Referer': 'https://music.163.com/song?id=26620756', 'Host': 'music.163.com', 'User-Agent': ua.random } def get_comments(page,ite): # 获取评论信息 # """ for key, values in ite.items(): song_id = key song_name = values ip_list = [IP列表] url = 'http://music.163.com/api/v1/resource/comments/R_SO_4_'+ song_id +'?limit=20&offset=' + str(page) proxies = get_random_ip(ip_list) try: response = requests.get(url=url, headers=headers,proxies=proxies) except Exception as e: print (page) print (ite) return 0 result = json.loads(response.text) items = result['comments'] for item in items: # 用户名 user_name = item['user']['nickname'].replace(',', ',') # 用户ID user_id = str(item['user']['userId']) print(user_id) # 评论内容 comment = item['content'].strip().replace('', '').replace(',', ',') # 评论ID comment_id = str(item['commentId']) # 评论点赞数 praise = str(item['likedCount']) # 评论时间 date = time.localtime(int(str(item['time'])[:10])) date = time.strftime("%Y-%m-%d %H:%M:%S", date) 八首歌的歌词代码: import requests from bs4 import BeautifulSoup import re import json import time import random import os headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3355.4 Safari/537.36', 'Referer': 'http://music.163.com', 'Host': 'music.163.com' } # 获取页面源码 def GetHtml(url): try: res = requests.get(url=url, headers=headers) except: return None return res.text # 提取歌手歌词信息 def GetSongsInfo(url): print('[INFO]:Getting Songs Info...') html = GetHtml(url) soup = BeautifulSoup(html, 'lxml') links = soup.find('ul', class_='f-hide').find_all('a') if len(links) < 1: print('[Warning]:_GetSongsInfonot find...') Info = {'ID': [], 'NAME': []} for link in links: SongID = link.get('href').split('=')[-1] SongName = link.get_text() Info['ID'].append(SongID) Info['NAME'].append(SongName) # print(Info) return Info def GetLyrics(SongID): print('[INFO]:Getting %s lyric...' % SongID) ApiUrl = 'http://music.163.com/api/song/lyric?id={}&lv=1&kv=1&tv=-1'.format(SongID) html = GetHtml(ApiUrl) html_json = json.loads(html) temp = html_json['lrc']['lyric'] rule = re.compile(r'[.*]') lyric = re.sub(rule, '', temp).strip() print(lyric) return lyric def main(): SingerId = input('Enter the Singer ID:') url = 'http://music.163.com/artist?id={}'.format(SingerId) # url = "http://music.163.com/artist?id=6457" Info = GetSongsInfo(url) IDs = Info['ID'] i = 0 for ID in IDs: lyric = GetLyrics(ID) SaveLyrics(Info['NAME'][i], lyric) i += 1 time.sleep(random.random() * 3) # print('[INFO]:All Done...') def SaveLyrics(SongName, lyric): print('[INFO]: Start to Save {}...'.format(SongName)) if not os.path.isdir('./results'): os.makedirs('./results') with open('./results/{}.txt'.format(SongName), 'w', encoding='utf-8') as f: f.write(lyric) 《沉默是金》 是错永不对 真永是真 任你怎说安守我本份 始终相信 沉默是金 这首歌是你亲自谱曲的。 当时,“谭张争霸”(1986-1989年,谭咏麟和张国荣为争夺乐坛地位,而在音乐上展开了全面竞争角逐)已经进入白热化。 你讨厌争来争去,于是借歌明志,推出了《沉默是金》。 你说,“任你怎说安守我本份,始终相信,沉默是金。” 清者自清,你的沉默,愈加彰显纯真本色。 《春夏秋冬》 秋天该很好 你若尚在场 秋风即使带凉 亦漂亮 深秋中的你填密我梦想 就像落叶飞 轻敲我窗 每到你生日时、每到新年时、每到你离开世界的那天时,你的歌下面就会有大量评论涌来。 你是4月1日走的,但是喜欢你的人,总是3月30日、31日甚至更早,就来你的音乐下面评论。 多少人希望你复活,甚至有人在重庆看到一位和你眉眼很像的出租者司机,都忍不住拍下。 你眼神中的澄澈和犹豫,事隔经年,还是那么让人无法忘记。 《倩女幽魂》 红尘里 美梦有几多方向 找痴痴梦幻中心爱 路随人茫茫 《倩女幽魂》里,你是羞涩怯弱的书生,走夜路时要点三盏灯笼,但却为了担心阳光把小倩的魂魄照散,死死地用肩膀扛着门板。 小倩走了,宁采臣的心也跟着死了。 哥哥走了,别人再演宁采臣,总感觉除却巫山不是云。 《当爱已成往事》 为何你不懂 只要有爱就有痛 有一天你会知道 人生没有我并不会不同 《霸王别姬》里,你演程蝶衣。 演得那么妩媚,以至于有人断言你是童子功出身。 其实,你只不过是重病还坚持训练而已。 你说“不疯魔,不成活”,所以你知道段小楼娶妻后,会嫉妒会难过会发狂。 戏里戏外,你都爱过,你说“只要有爱就有痛”,但却更像是唱给自己听。 你这样的纯粹和“认死理”,总是让粉丝很心疼你...... 《我》 孤独的沙漠里 一样盛放的赤裸裸 多么高兴 在琉璃屋中快乐生活 对世界说 甚么是光明和磊落 我就是我 是颜色不一样的烟火 多少人用你唱的那句“我就是我,是颜色不一样的烟火”来鼓励自己活出自我。 但最后你却已烟火一样的方式,离开了人世间。 几年前,梁朝伟在纪念你的演唱会上,拨通你的电话。 电话里,留言声依旧,“你好,我是leslie,有事请留言。” 梁朝伟沉默了,许久之后,淡淡说句:“宝荣啊,不如我们从头来过。” 《风继续吹》 风继续吹不忍远离 心里亦有泪不愿流泪望着你 过去多少快乐记忆 何妨与你一起去追 这是你的成名曲,所以你似乎很中意它。 每每参加演唱会,都要唱一唱。 最后一次唱起时,不知怎的竟然哭了,台下观众也跟着你哭。 因为这首歌,是你翻身的见证啊。 你在歌坛摸爬滚打那么多年,一直寂寂无声,是这首歌才没有让你被埋没。 《玻璃之情》 不信眼泪 能令失落的你爱下去 难收的覆水 将感情漫漫荡开去 如果你太累 及时地道别没有罪 你曾说,每次唱歌前,都要给这首歌编一个故事,唱的时候,脑海中浮现出故事的画面,而这种画面感,让你唱得很投入。 为什么你的歌经久不息,就是因为你不仅对人重情,对歌也重情。 《风再起时》 我回头再往某年 像失色照片乍现眼前 这个茫然困惑少年 愿一生以歌 投入每天永不变 1989年,已经见过了娱乐圈太多浮沉的你,突然宣布告别乐坛。 你见过喧嚣,但你却不属于喧嚣。 策划告别演唱会之前,你和音乐人陈少琪、黎小田商量。 陈少琪说,“你不是有一首成名曲叫《风继续吹》么?不如歌名就叫《风再起时》,就是希望只要一起风的时候,歌迷就会想起你的这首歌。” 边上的黎小田,花了十五分钟就在随手找来的白纸上,谱好了曲子。 很快,陈少琪也把词填好了。 有人说,这首歌里的歌词,就是为你量身定做的:“我回头再往某年,像失色照片乍现眼前,这个茫然困惑少年,愿一生以歌,投入每天永不变”。 愿一生以歌,投入每天永不变...... 不知道现在的你,还唱歌吗?还演戏吗? 你知不知道,今天很多人都在想你。 谢谢你,留给我们这么多歌曲和电影。 愿你在另外一个世界,永远没有忧郁和伤心。 以上。

优秀的个人博客,低调大师

统计图钻的明细报表在非模态窗口中显示

润乾报表的统计图可以在图例 / 图形上设置超链接,从而实现钻取到明细报表的操作,钻取得到的报表可以在新窗口或者当前窗口中打开。关于如何在统计图的图形 / 图例上设置超链接,在用户手册中有常用示例的介绍。今天小编要给大家介绍的是如何在非模态窗口中打开图形超链接钻取得到的报表。首先创建一张带有统计图的报表,报表文件名为 planWorkView2.rpx。增加数据集 ds1, 下面是 ds1 的数据:在 A2 单元格中增加一个柱形图,统计图的分类和系列值数据分别来源于数据集 ds1 的 ORG_NAME 和 PLAN_CON。 在显示外观的选项卡中,设置图形超链接的表达式:=“javascript:showModal(’showReport.jsp?rpx=/planItemsInfo.rpx&reportType=2&arg3=”+ @orgId + “’, 800, 350)”,在超链接目标窗口中设置 =“_self”。 一张明细报表 planItemsInfo.rpx,明细报表中定义参数,可接收数据报表传递过来的参数。 在报表展现的页面 showReport.jsp 中增加 js 方法,调用非模态窗口来展现报表。 下面通过 showReport.jsp 访问 planWorkView2.rpx, 点击图形,看下在非模态窗口展现的效果吧! 由于使用的是非模态窗口展现明细报表,因此不会在关闭前强制焦点一直停留这个窗口上,而是可以进行任意切换,不会影响用户的其他操作。如果换成模态弹窗的话,则需要用户进行功能操作后,关闭窗口,才可进行其他操作。 好了,以上是关于在非模态窗口展现明细报表的介绍,如果你也有这样的需求,不妨参照本文介绍的图形超链接表达式的写法试一试吧!

优秀的个人博客,低调大师

歌词信息,写入ES

1.说明 爬虫采用Java的Jsoup ElasticSearch请在阿里云官网购买,采用客户端x-pack-transport 歌词网站来源:http://www.kuwo.cn/artist/index 2. 歌词网站分析 此处采用了比较笨的一种方式,即逐个分析每个请求的url,这样可以方便代码编写,就不用模拟器了(如需使用模拟器可参考使用cdp4j模拟点击事件等,但简单试了下不是很好用,且效率低) a) 歌手获取分析 在http://www.kuwo.cn/artist/index 查看分页按钮的click事件,从js中找到分页请求的url从click事件的artist.js中找到相关url如下图所示其中pn参数即为页码参数 var b = host + "/artist/indexAjax?category=" + index + "&a

优秀的个人博客,低调大师

Python网络爬虫之爬百度贴吧网址并保存

通过urllib2+resquest爬虫百度贴吧网址,并保存至该工作目录下 一、示例代码 示例代码 代码解析: 1.首先定义一个baidu_tieba的函数:def baidu_tieba() 2.抓取的网页给重新命名并保存在工作目录下: name = string.zfill(i,5) +'.html'; url = urllib2.Request(baurl) m = urllib2.urlopen(url).read() f.write(m) 3.手动输入网址、网页的页数等raw_input() 4.调用baidu_tieba的函数:def baidu_tieba()运行程序并查看运行结果

优秀的个人博客,低调大师

🔥支持 AI 代码流程引擎 FlowLong 1.2.2 发布

开源地址:https://gitee.com/aizuda/flowlong 开源地址:https://github.com/aizuda/flowlong 官网文档:https://flowlong.aizuda.com 更新日志: feat: 新增持仓抄送动态扩展提供参与者 feat: 新增允许删除临时状态节点 feat: 新增支持临时节点状态 opt: 优化springboot4版本控制配置 opt: 优化实现监听异步任务监听处理器注释说明 可视化流程审批效果如下:

优秀的个人博客,低调大师

🔥代码国产流程引擎 FlowLong 1.1.7 发布

开源地址:https://gitee.com/aizuda/flowlong 开源地址:https://github.com/aizuda/flowlong 官网文档:https://flowlong.aizuda.com 支持全流程操作监听,仅 8 张表实现整个流程引擎(更符合中国人的思维模式设计),截至当前近 300 家企业自用登记接入使用。300 多家企业包括,国家计算中心,电信 等国企已上车,你还在等什么呢? 开源登记使用名单如下,企业版用户暂不公开 https://gitee.com/aizuda/flowlong/issues/IB5K4V Flowlong 1.1.7 主要亮点 feat: 新增执行跳转任务归档设置执行参数 feat: 新增获取已执行节点测试用例 opt: 优化获取当前已使用的节点key列表 opt: 优化获取上一个节点调整为只返回审批节点 opt: 优化FlwInstance类的variableToMap方法返回可修改Map

优秀的个人博客,低调大师

🔥代码国产流程引擎 FlowLong 1.1.6 发布

开源地址:https://gitee.com/aizuda/flowlong 开源地址:https://github.com/aizuda/flowlong 官网文档:https://flowlong.aizuda.com 支持全流程操作监听,仅 8 张表实现整个流程引擎(更符合中国人的思维模式设计),截至当前近 300 家企业自用登记接入使用。300 多家企业包括,国家计算中心,电信 等国企已上车,你还在等什么呢? 开源登记使用名单如下,企业版用户暂不公开 https://gitee.com/aizuda/flowlong/issues/IB5K4V Flowlong 1.1.6 主要亮点 feat: 新增支持流程暂存待审功能 feat: 新增驳回支持终止审批流程策略 feat: 新增构建流程模型方法 opt: 优化自定义ID获取兼容用户预设置ID值 opt: 优化自定义ID生成器类名及初始化避免与其它框架冲突 opt: 优化创建抄送任务通知区分手动抄送和自动抄送时事件 opt: 优化多次委托新增委托任务测试用例

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册