在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用Python抓取用戶發(fā)的話題

馬哥Linux運(yùn)維 ? 來源:腳本之家 ? 作者:j_hao104 ? 2021-09-05 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大多數(shù)APP里面返回的是json格式數(shù)據(jù),或者一堆加密過的數(shù)據(jù) 。這里以超級(jí)課程表APP為例,抓取超級(jí)課程表里用戶發(fā)的話題。

1、抓取APP數(shù)據(jù)包

表單:

表單中包括了用戶名和密碼,當(dāng)然都是加密過了的,還有一個(gè)設(shè)備信息,直接post過去就是。

另外必須加header,一開始我沒有加header得到的是登錄錯(cuò)誤,所以要帶上header信息。

2、登錄

登錄代碼:

import urllib2from cookielib import CookieJarloginUrl = ‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action’headers = {‘Content-Type’: ‘a(chǎn)pplication/x-www-form-urlencoded; charset=UTF-8’,

‘User-Agent’: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H)’,‘Host’: ‘120.55.151.61’,‘Connection’: ‘Keep-Alive’,‘Accept-Encoding’: ‘gzip’,‘Content-Length’: ‘207’,}loginData =

‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’cookieJar = CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))req = urllib2.Request(loginUrl, loginData, headers)loginResult = opener.open(req).read()print loginResult

登錄成功 會(huì)返回一串賬號(hào)信息的json數(shù)據(jù)

和抓包時(shí)返回?cái)?shù)據(jù)一樣,證明登錄成功

3、抓取數(shù)據(jù)

用同樣方法得到話題的url和post參數(shù)

下見最終代碼,有主頁獲取和下拉加載更新。可以無限加載話題內(nèi)容。

#!/usr/local/bin/python2.7# -*- coding: utf8 -*-“”“超級(jí)課程表話題抓取”“”import urllib2from cookielib import CookieJarimport json‘’‘ 讀Json數(shù)據(jù) ’‘’def fetch_data(json_data):

data = json_data[‘data’]timestampLong = data[‘timestampLong’]messageBO = data[‘messageBOs’]topicList = []for each in messageBO:topicDict = {}if each.get(‘content’, False):

topicDict[‘content’] = each[‘content’]topicDict[‘schoolName’] = each[‘schoolName’]topicDict[‘messageId’] = each[‘messageId’]topicDict[‘gender’] = each[‘studentBO’][‘gender’]topicDict[‘time’] = each[‘issueTime’]print each[‘schoolName’],

each[‘content’]topicList.append(topicDict)return timestampLong, topicList‘’‘ 加載更多 ’‘’

def load(timestamp, headers, url):headers[‘Content-Length’] = ‘159’loadData = ‘timestamp=%s&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’ % timestampreq = urllib2.Request(url, loadData, headers)loadResult = opener.open(req)

.read()loginStatus = json.loads(loadResult).get(‘status’, False)if loginStatus == 1:print ‘load successful!’timestamp, topicList = fetch_data(json.loads(loadResult))load(timestamp, headers, url)else:print ‘load fail’print loadResultreturn FalseloginUrl =

‘http://120.55.151.61/V2/StudentSkip/loginCheckV4.action’topicUrl =

‘http://120.55.151.61/V2/Treehole/Message/getMessageByTopicIdV3.action’headers = {‘Content-Type’: ‘a(chǎn)pplication/x-www-form-urlencoded; charset=UTF-8’,‘User-Agent’: ‘Dalvik/1.6.0 (Linux; U; Android 4.1.1; M040 Build/JRO03H)’,‘Host’: ‘120.55.151.61’,‘Connection’: ‘Keep-Alive’,‘Accept-Encoding’: ‘gzip’,‘Content-Length’: ‘207’,}

‘’‘ ---登錄部分--- ’‘’loginData = ‘phoneBrand=Meizu&platform=1&deviceCode=868033014919494&account=FCF030E1F2F6341C1C93BE5BBC422A3D&phoneVersion=16&password=A55B48BB75C79200379D82A18C5F47D6&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’cookieJar = CookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))req = urllib2.Request(loginUrl, loginData, headers)loginResult = opener.open(req).read()loginStatus = json.loads(loginResult).get(‘data’, False)if loginResult:print ‘login successful!’else:print ‘login fail’print loginResult‘’‘ ---獲取話題--- ’‘’topicData =

‘timestamp=0&phoneBrand=Meizu&platform=1&genderType=-1&topicId=19&phoneVersion=16&selectType=3&channel=MXMarket&phoneModel=M040&versionNumber=7.2.1&’headers[‘Content-Length’] = ‘147’topicRequest = urllib2.Request(topicUrl, topicData, headers)topicHtml = opener.open(topicRequest).read()topicJson = json.loads(topicHtml)topicStatus = topicJson.get(‘status’, False)print topicJsonif topicStatus == 1:print ‘fetch topic success!’timestamp, topicList = fetch_data(topicJson)load(timestamp, headers, topicUrl)

結(jié)果:

562957e4-0dd5-11ec-8fb8-12bb97331649.jpg

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7250

    瀏覽量

    91512
  • APP
    APP
    +關(guān)注

    關(guān)注

    33

    文章

    1586

    瀏覽量

    74007
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4825

    瀏覽量

    86446

原文標(biāo)題:利用Python爬蟲抓取手機(jī)APP的傳輸數(shù)據(jù)

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Allegro Skill布局功能之遠(yuǎn)程抓取器件介紹

    過使用“遠(yuǎn)程抓取器件”功能,用戶可以批量選取多個(gè)器件,隨后通過鼠標(biāo)左鍵逐個(gè)點(diǎn)擊放置,實(shí)現(xiàn)高效精準(zhǔn)的器件布局。該功能特別適用于在大規(guī)模芯片周邊配置去耦電容、電阻等元件,能夠快速將元件定位到目標(biāo)焊盤附近或芯片背面。
    的頭像 發(fā)表于 05-08 10:34 ?451次閱讀
    Allegro Skill布局功能之遠(yuǎn)程<b class='flag-5'>抓取</b>器件介紹

    如何獲取用于開發(fā)fx2的sdk和示例源代碼?

    大家好 我正在使用 FX2 設(shè)備,以前也使用過 FX3 設(shè)備。 使用 FX3 設(shè)備 SDK,當(dāng)我下載它時(shí),我在安裝文件夾中獲得了許多示例源代碼,但是它沒有 FX2 的示例源代碼,我如何獲取用于開發(fā) fx2 的 sdk 和示例源代碼?
    發(fā)表于 05-07 07:25

    復(fù)合機(jī)器人抓取精度的影響因素及提升策略

    復(fù)合機(jī)器人結(jié)合了移動(dòng)機(jī)器人(如AGV)和機(jī)械臂的功能,廣泛應(yīng)用于物流、制造等領(lǐng)域。抓取精度是其核心性能指標(biāo)之一,直接影響作業(yè)效率和產(chǎn)品質(zhì)量。本文將探討復(fù)合機(jī)器人抓取精度的影響因素及提升策略。
    的頭像 發(fā)表于 04-12 11:15 ?297次閱讀

    python入門圣經(jīng)-高清電子書(建議下載)

    和Pygal 等強(qiáng)大的Python 庫和工具介紹,以及列表、字典、if 語句、類、文件與異常、代碼測(cè)試等內(nèi)容; 第二部分將理論付諸實(shí)踐,講解如何開發(fā)三個(gè)項(xiàng)目,包括簡(jiǎn)單的Python 2D 游戲開發(fā)如何利用數(shù)據(jù)
    發(fā)表于 04-10 16:53

    鴻蒙應(yīng)用元服務(wù)開發(fā)-Account Kit獲取華為賬號(hào)用戶信息概述

    詳細(xì)接入體驗(yàn)可參考Account Kit提供的SampleCode示例工程。 典型場(chǎng)景: 1、元服務(wù)需要完善用戶頭像信息,參見獲取頭像。 2、元服務(wù)提供的服務(wù)依賴用戶手機(jī)號(hào),需要獲取用戶手機(jī)號(hào),參見獲取
    發(fā)表于 04-02 11:10

    2025年電子行業(yè)值得關(guān)注的話題

    《What's Next》是安富利推出的全新數(shù)字讀物,面向任何想要了解電子行業(yè)未來發(fā)展趨勢(shì)的用戶,安富利憑借在全球市場(chǎng)的深厚積淀與廣泛影響力,為您精選最具前瞻性的議題,呈現(xiàn)精準(zhǔn)的市場(chǎng)趨勢(shì)、深刻的技術(shù)洞察。
    的頭像 發(fā)表于 02-18 17:36 ?855次閱讀

    Python庫解析:通過庫實(shí)現(xiàn)代理請(qǐng)求與數(shù)據(jù)抓取

    Python中,有多個(gè)庫可以幫助你實(shí)現(xiàn)代理請(qǐng)求和數(shù)據(jù)抓取。這些庫提供了豐富的功能和靈活的API,使得你可以輕松地發(fā)送HTTP請(qǐng)求、處理響應(yīng)、解析HTML/XML/JSON數(shù)據(jù),以及進(jìn)行復(fù)雜的網(wǎng)絡(luò)操作。
    的頭像 發(fā)表于 10-24 07:54 ?463次閱讀

    如何利用海外爬蟲IP進(jìn)行數(shù)據(jù)抓取

    利用海外爬蟲IP進(jìn)行數(shù)據(jù)抓取需要綜合考慮多個(gè)方面。
    的頭像 發(fā)表于 10-12 07:54 ?568次閱讀

    如何利用python和API查詢IP地址?

    Python中,直接查詢IP地址的地理位置或詳細(xì)信息(如所屬國家、城市等)通常需要依賴外部API服務(wù),因?yàn)?b class='flag-5'>Python標(biāo)準(zhǔn)庫本身不提供直接查詢IP地址地理位置的功能。以下是一個(gè)使用requests
    發(fā)表于 08-28 11:55

    第二屆大會(huì)回顧第25期 | OpenHarmony上的Python設(shè)備應(yīng)用開發(fā)

    Python以其簡(jiǎn)單、易學(xué)和功能強(qiáng)大而聞名,有著廣泛的用戶群體。采用Python開發(fā)有助于降低OpenHarmony的學(xué)習(xí)門檻。如何在OpenHarmony上用Python開發(fā)設(shè)備應(yīng)用
    的頭像 發(fā)表于 08-27 11:53 ?1169次閱讀
    第二屆大會(huì)回顧第25期 | OpenHarmony上的<b class='flag-5'>Python</b>設(shè)備應(yīng)用開發(fā)

    利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN

    本文將詳細(xì)介紹如何利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN。
    的頭像 發(fā)表于 08-12 17:59 ?914次閱讀

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的庫和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語言。而在深度學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 08-01 15:27 ?3197次閱讀

    如何長(zhǎng)時(shí)間抓取DTU設(shè)備實(shí)時(shí)日志?

    如何長(zhǎng)時(shí)間抓取DTU設(shè)備實(shí)時(shí)日志?
    發(fā)表于 07-26 06:31

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法是一個(gè)涉及多個(gè)技術(shù)領(lǐng)域的復(fù)雜話題,包括計(jì)算機(jī)視覺、深度學(xué)習(xí)、以及圖像處理等。在這里,我將概述一個(gè)基本的流程,包括數(shù)據(jù)準(zhǔn)備、模型選擇、訓(xùn)練過程、以及測(cè)試與評(píng)估,并附上簡(jiǎn)單的代碼示例。
    的頭像 發(fā)表于 07-14 11:52 ?1658次閱讀

    深度學(xué)習(xí)常用的Python

    深度學(xué)習(xí)常用的Python庫,包括核心庫、可視化工具、深度學(xué)習(xí)框架、自然語言處理庫以及數(shù)據(jù)抓取庫等,并詳細(xì)分析它們的功能和優(yōu)勢(shì)。
    的頭像 發(fā)表于 07-03 16:04 ?1119次閱讀
    主站蜘蛛池模板: 日韩成人免费观看 | 国产在线理论片免费播放 | 青娱乐久草 | 欧洲精品不卡1卡2卡三卡 | 操美女免费网站 | jiucao在线观看精品 | 青草午夜精品视频在线观看 | 激情六月丁香婷婷 | 国产精品露脸脏话对白 | 亚洲婷婷国产精品电影人久久 | 天堂网在线www资源在线 | 玖玖爱在线播放 | h网站免费在线观看 | 一区中文字幕 | 日本黄视频网站 | 国产小视频在线观看 | 亚洲第成色999久久网站 | 国产在线视频h | 婷婷深爱五月 | 午夜小视频在线播放 | 一级特黄a视频 | 国产在线99 | 黄色短视频软件 | 亚洲乱码卡一卡二卡三永久 | 伊人网综合视频 | 嫩草影院久久国产精品 | 高清精品女厕在线观看 | 色天天综合网色鬼综合 | 白丝丝袜高跟国产在线视频 | 日本丰满毛茸茸熟妇 | 亚洲国产成人久久精品影视 | 天天操一操| 在线色站 | 天天综合天天综合 | 天天综合色一区二区三区 | 四虎精品成在线播放 | 午夜撸 | 性做久久久久久 | 一区二区网站 | 深夜视频在线免费 | 222在线视频免费观看 |