離開(kāi)派代好久了,之前一直在忙其他的項(xiàng)目和幫京東搜索部門組建搜索反饋群的事情,一直也沒(méi)多少時(shí)間,很多人加我QQ咨詢一些問(wèn)題,有時(shí)候因?yàn)闀r(shí)間的因素也沒(méi)有給予詳細(xì)的解答,心中有愧,趁著夜深人靜的時(shí)候整理下思緒,從淺到深的普及一下京東的搜索知識(shí)以及最近京東的一些變革。對(duì)一些基礎(chǔ)的小白問(wèn)題,請(qǐng)?jiān)试S我貼一些資料~最近的變革也會(huì)穿插其中。
一、最常問(wèn)的搜索多久更新?很多人搞不明白,下面所說(shuō)的情況不包含系統(tǒng)故障。
搜索上更新分為兩部分:增量更新和全量更新(兩者不沖突)。
增量更新:商品組及時(shí)將消息發(fā)送到搜索,搜索將接受到的消息更新。一般10-30分鐘內(nèi)即可被搜索到。
全量更新:搜索每天都會(huì)對(duì)搜索的數(shù)據(jù)庫(kù)重新建索引,保證在數(shù)據(jù)庫(kù)中的數(shù)據(jù)都更新(下午6點(diǎn)離線(不影響線上)開(kāi)始生成數(shù)據(jù),再推送到線上,期間時(shí)間較長(zhǎng),第二天PC、列表、其它所有客戶端9點(diǎn)前都會(huì)基本完成更新)。
A:
1. 上架成功后,一般是半個(gè)小時(shí)內(nèi)(沒(méi)有勾選“上柜不展示”,去除此勾選是第二天被索引,若在18點(diǎn)后去除則是第三天被索引)即可被索引到,最遲第二天被索引(增量沒(méi)接到消息時(shí)通過(guò)全量更新)。
2. 下架成功后,立刻--10分鐘后不再被搜索到
3. 庫(kù)存變更后,立刻—30分鐘可以被搜索識(shí)別到新庫(kù)存
4. 價(jià)格變動(dòng)后,立刻—10分鐘可以被搜索識(shí)別到新價(jià)格
5. 銷量、金額,搜索反饋等第二天更新
6. 配送區(qū)域、限購(gòu)區(qū)域等第二天更新
7. 圖片、屬性區(qū)(品牌等)、標(biāo)簽第二天更新
8. 店鋪內(nèi)的分類第二天更新。
9. 基礎(chǔ)廣告詞第二天更新(最好白天更新,因廣告詞單獨(dú)邏輯,每天都是晚上讀數(shù)據(jù)庫(kù))。
10. 價(jià)格模型數(shù)據(jù)每周更新一次(搜索頁(yè)周二/列表頁(yè)周一更新),品牌模型數(shù)據(jù)(依賴于商品表和訂單表)每天更新。
二、Q:不同顏色、不同尺寸的SKU都可以搜索到嗎?
A:
1、 SKU只有顏色時(shí),所有顏色的SKU都可以搜索到
2、 SKU有顏色和尺碼時(shí),同顏色可以搜到一個(gè)尺碼,是15日銷量最大且有庫(kù)存的,其他尺碼也可索引,但前端展示還是銷量最大且有庫(kù)存的。
3、 SKU顏色為空,只有尺碼時(shí),所有尺碼都可以被搜索到。
備注:
1、此處“庫(kù)存”數(shù)據(jù)第二天更新
2、上架當(dāng)天同顏色不同尺碼全部能搜索到,當(dāng)全量更新后識(shí)別同顏色不同尺碼中有庫(kù)存且銷量最大的。
3、同一個(gè)商品的相同顏色只能索引一個(gè)顏色。
三、Q:商品的哪些信息可以被搜索到?
A:搜索首先需文本匹配,而不是商品所有信息的文本都可被搜索,不同品類被索引的字段不同,如下:
3C和日百品類:商品名稱、品牌、同義詞、三級(jí)分類(AB、A/B分類不索引如奶瓶奶嘴、戒指/耳飾)、擴(kuò)展屬性、基礎(chǔ)廣告詞、店鋪名稱、店鋪ID、顏色、尺碼(3C顏色和尺碼除外)、3C規(guī)格參數(shù)(型號(hào)|顏色|操作系統(tǒng)|網(wǎng)卡|核心數(shù)|推薦用途|適用機(jī)型|適用型號(hào)|打印機(jī)類型|聲道系統(tǒng)|定頻/變頻|自動(dòng)化程度|類別|主板兼容|適用范圍|接口類型|散熱器類型|核心|攝像頭|CPU核數(shù)|CPU型號(hào)|CPU類型)、送禮搜索、大家說(shuō)。
圖書音像品類:
圖書商品系列名稱、圖書商品出版商、圖書商品作者、圖書商品譯者、圖書商品外文名稱、圖書商品編輯、圖書商品美編、同義詞字段、店鋪名稱、擴(kuò)展屬性、書寫、高級(jí)關(guān)鍵詞、二級(jí)分類名(后續(xù)會(huì)替換成三級(jí)分類)、ISBN。
音像商品系列名稱、音像商品導(dǎo)演、音像商品演員、音像商品外文名稱、音像商品出版社、音像商品演唱者、音像商品表演者、音像商品錄制者、同義詞字段、二級(jí)分類名稱、店鋪名稱、擴(kuò)展屬性、產(chǎn)品評(píng)級(jí)、廠牌、發(fā)行公司、介質(zhì)、作詞、作曲、編劇、指揮、知名樂(lè)團(tuán)、演奏、又名、高級(jí)關(guān)鍵詞。
行動(dòng)建議:在不影響現(xiàn)有的正確搜索結(jié)果,采銷若需添加新的索引字段,請(qǐng)?zhí)峁┫嚓P(guān)的數(shù)據(jù)給搜索評(píng)估(依據(jù):對(duì)現(xiàn)有搜索結(jié)果帶來(lái)正向影響)。
四、Q:為什么我關(guān)心的商品沒(méi)被搜索到?
A:
1、 新品上架最遲第二天才能被索引到,請(qǐng)先確認(rèn)是否上架成功,另外是否后臺(tái)設(shè)置了上架不展示(圖書分類無(wú)上柜不展示)。
2、 確認(rèn)搜索的關(guān)鍵詞,在商品已被索引的字段中包含。
3、 用商品的全稱(標(biāo)題所有文本)去搜索,看是否可以搜出來(lái)。因有時(shí)短詞搜索你關(guān)注的商品可能因銷量等數(shù)據(jù)很少而排在后面,不容易被發(fā)現(xiàn)。
4、 同顏色不同尺碼只索引銷量最大且有庫(kù)存的SKU,其他SKU的文本也可被索引,但展示的是銷量最大且有庫(kù)存的SKU;
5、 被識(shí)別品牌作弊的SKU,在搜索品牌庫(kù)中的品牌詞時(shí)被過(guò)濾;
6、商品需正確綁定品牌;
7、“送XX禮物”、“XX禮物”等搜索詞會(huì)觸發(fā)搜索送禮邏輯,反饋中有這些字段(即評(píng)價(jià)中出現(xiàn)2次以上)的才會(huì)被索引(只在標(biāo)題等含有這些字段是不行的)。
8. 店鋪內(nèi)分類綁定需再第二天才能被索引;
9. 搜索結(jié)果超3W會(huì)被截?cái)啵ㄎ谋?商品質(zhì)量分),但搜索頁(yè)數(shù)只展示100頁(yè)(解決點(diǎn)擊篩選后頁(yè)數(shù)變多的體驗(yàn)問(wèn)題)。
五、 Q:為什么我關(guān)心的商品排名突然下降很大?
A:
1. 先確保用商品全稱是否搜索到(單純修改詳情頁(yè)不會(huì)影響排名);
2. 當(dāng)前用戶所在城市無(wú)庫(kù)存的商品降權(quán),請(qǐng)先查看當(dāng)前訪問(wèn)jd.com的用戶所在地,確認(rèn)該商品在本地區(qū)是否有貨
3. 搜索規(guī)則是根據(jù)各個(gè)因子的數(shù)據(jù)來(lái)綜合排名,若數(shù)據(jù)發(fā)生變化,排名也會(huì)變化:如搜索計(jì)算的是3日和15日完成銷量數(shù)據(jù),若計(jì)算周期內(nèi)商品銷量數(shù)據(jù)已不再像前一天那么高則排名自然會(huì)受到影響;若在前一天計(jì)算權(quán)重時(shí),與競(jìng)爭(zhēng)對(duì)手銷量差不多,但轉(zhuǎn)換率和好評(píng)率競(jìng)爭(zhēng)對(duì)手有量變到質(zhì)變的提高,則商品排名也會(huì)受影響。(排除搜索系統(tǒng)異常)
4. 作弊商品會(huì)被降權(quán);
5. 價(jià)格模型對(duì)商品排名也有影響。(價(jià)格模型每周二晚更新,周三排名有可能下降)
6. 店鋪穿插會(huì)使某些店鋪的展示數(shù)有所下降,但是會(huì)提升前幾頁(yè)的資源分配。
7. 商品的上下架有時(shí)也會(huì)影響當(dāng)天的排名(商品質(zhì)量分,此權(quán)重在下午2-4點(diǎn)計(jì)算,若在此時(shí)間段上下架,會(huì)計(jì)算不到當(dāng)天的商品質(zhì)量分,但取不到商品質(zhì)量分時(shí),搜索會(huì)默認(rèn)為是新品賦予一個(gè)權(quán)重值=3),第二天會(huì)恢復(fù)正常。
8. 若修改了商品銷售屬性(如A商品無(wú)尺碼,商家增加B商品時(shí),給A商品多添加了尺碼)導(dǎo)致SKUID變化會(huì)影響排名(不管修改什么屬性,只要SKUID不變,商品排名就不會(huì)受太大影響,除非商品更換分類)。
9.最近正在分批上線的品牌模型和人氣模型,以及京東系統(tǒng)AB,不包含系統(tǒng)故障因素。
======================================================
以上是針對(duì)最近提問(wèn)一些比較多的基礎(chǔ)的問(wèn)題,下面說(shuō)下京東搜索優(yōu)化的一些重要知識(shí)點(diǎn)。
1、高相關(guān)分類:我們大家都知道京東的搜索是有高相關(guān)分類一說(shuō)的,高相關(guān)分類顧名思義就是和搜索關(guān)鍵詞相關(guān)性最高的三級(jí)類目,此三級(jí)類目會(huì)在搜索的時(shí)候優(yōu)先展現(xiàn),這個(gè)是系統(tǒng)根據(jù)很多緯度的數(shù)據(jù)計(jì)算出來(lái)的,并不是人為的。
以關(guān)鍵詞“紅豆”為例,紅豆是一種食材,同時(shí)這個(gè)詞也是一個(gè)男裝品牌的名稱,那么在京東搜索的時(shí)候會(huì)優(yōu)先什么類目呢,大家可以自己搜索下試試。系統(tǒng)判斷“米面雜糧”類目更適合展現(xiàn)給消費(fèi)者,對(duì)平臺(tái)的GMV更有利,所以會(huì)優(yōu)先展示米面雜糧類目的產(chǎn)品,而不展示男裝類目。關(guān)于這塊,可以使用第三方工具“老板通”查詢。
2、文本相關(guān)性:京東會(huì)對(duì)平臺(tái)產(chǎn)品建立索引,然后當(dāng)消費(fèi)者搜索的時(shí)候,系統(tǒng)就會(huì)根據(jù)索引進(jìn)行召回,并根據(jù)文本相關(guān)性得分進(jìn)行排序,這是整個(gè)搜索系統(tǒng)工作的大概流程。那么系統(tǒng)會(huì)索引產(chǎn)品的那些屬性呢?給大家總結(jié)下:
a、標(biāo)題
b、副標(biāo)題廣告詞
c、品牌
d、商品屬性
e、銷售屬性
f、詳情文字
g、評(píng)價(jià)內(nèi)容及標(biāo)簽
h、店鋪名稱
大家可以根據(jù)以上總結(jié)的點(diǎn)來(lái)對(duì)自己的產(chǎn)品和店鋪來(lái)進(jìn)行針對(duì)性的優(yōu)化,思考怎么讓系統(tǒng)在消費(fèi)者進(jìn)行搜索的時(shí)候會(huì)對(duì)你的信息進(jìn)行召回。
那怎么知道消費(fèi)者會(huì)對(duì)哪些詞進(jìn)行搜索呢,可以參考一些行業(yè)數(shù)據(jù),比如數(shù)據(jù)羅盤的熱搜詞或者老板通的關(guān)鍵詞以及類目數(shù)據(jù)查詢,可以直接看到類目或者指定關(guān)鍵詞每天的成交單數(shù),這個(gè)數(shù)據(jù)是過(guò)濾之后的,可以以此推算某個(gè)關(guān)鍵詞對(duì)應(yīng)位置的所需的刷單單量。
前八的坑位平均所需單量計(jì)算公式:?jiǎn)翁煺~訂單量*0.9*0.4/8
0.9為第一頁(yè)成交單量占比,0.4為前八成交量在第一頁(yè)的占比,8為坑位數(shù)
這個(gè)系數(shù)是全平臺(tái)平均,某些類目可能有偏差,但誤差不大。
建議可以把行業(yè)數(shù)據(jù)全部拉出來(lái),做成表格,包含搜索量、成交量、客單、在競(jìng)商品數(shù)、前八所需單量等多列對(duì)比緯度,來(lái)對(duì)關(guān)鍵詞進(jìn)行判斷,以達(dá)到減少投入增大效果的目的。
3、價(jià)格模型:京東于九月份基本全類目上線了價(jià)格模型,目前是第一階段的價(jià)格模型,二階段的多區(qū)間帶價(jià)格模型預(yù)計(jì)明年才能和大家見(jiàn)面了,先說(shuō)一階段價(jià)格模型,這個(gè)是比較簡(jiǎn)單的,就是如果你的產(chǎn)品售價(jià)在系統(tǒng)給予的高權(quán)重價(jià)格區(qū)間內(nèi),你的產(chǎn)品就可以獲得加權(quán),只要在區(qū)間內(nèi),不分價(jià)格高低,權(quán)重都一樣,在區(qū)間內(nèi)再進(jìn)行分段就是二階段價(jià)格模型了。京東明年的方向會(huì)主抓品牌這塊,整個(gè)平臺(tái)會(huì)對(duì)優(yōu)質(zhì)的產(chǎn)品進(jìn)行資源傾斜,其中在搜索這塊,能體現(xiàn)產(chǎn)品優(yōu)質(zhì)的一個(gè)系統(tǒng)判別緯度就是高價(jià),那么這塊就很容易做了。
可以不斷的給自己的產(chǎn)品加價(jià),然后刷新看排名,自己把握這個(gè)度,別一雙襪子都加到一百多,排名上去了也賣不掉,這種情況是真是出現(xiàn)過(guò)。價(jià)格模型是每周二進(jìn)行更新,周期7天。
4、標(biāo)題優(yōu)化:標(biāo)題優(yōu)化說(shuō)幾點(diǎn)技巧
a、標(biāo)題內(nèi)的括號(hào)“()”內(nèi)的內(nèi)容是不計(jì)入標(biāo)題長(zhǎng)度的,一些不重要的說(shuō)明信息可以寫在里面
b、副標(biāo)題可以被索引,可以展示在搜索結(jié)果頁(yè),優(yōu)惠信息等可以寫在這,并且可以展現(xiàn)在搜索頁(yè)
c、標(biāo)題越短越好是沒(méi)錯(cuò)的,權(quán)重高是一個(gè),第二是搜索可以看到副標(biāo)題,空格是不計(jì)入長(zhǎng)度的,但如果想做完全匹配的詞,建議加空格,比如“風(fēng)衣 女”,消費(fèi)者喜歡加空格搜索或者搜索下拉框就是帶空格的,那么建議加空格,因?yàn)橄到y(tǒng)優(yōu)先召回完全匹配
d、同義詞縮減,比如“女士”和“女”在京東系統(tǒng)眼里,他倆是一樣的,沒(méi)區(qū)別,可以直接寫成“女”以縮短標(biāo)題。
e、最好不要堆砌關(guān)鍵詞,標(biāo)題長(zhǎng)權(quán)重低不說(shuō),被抓到要扣分,雖然被抓的比較小,建議把所有想做的詞拉出來(lái)之后,進(jìn)行拼裝縮減,詳情見(jiàn)我以前寫的帖子(半途而廢了,不好意思)。
5、流量入口概況:目前京東的流量入口分兩大塊
PC:搜索+類目列表頁(yè)
移動(dòng)端:APP+M端+微信+手Q
搜索成交訂單量在這兩大端口的成交量都在一半以上。說(shuō)兩點(diǎn)關(guān)于這塊的事情:
a、移動(dòng)端的微信和手Q的類目列表頁(yè)其實(shí)不是和APP一樣的,他們的類目頁(yè)其實(shí)是某些關(guān)鍵詞的搜索頁(yè),大家可以自己試試,如果拿到這些詞在PC的排名,相當(dāng)于微信和手Q的類目也拿到了。(目前是這樣)
b、移動(dòng)端和PC端的排名正在進(jìn)行拆分,已經(jīng)有個(gè)別類目拆分完成了,還有正在進(jìn)行測(cè)試的,數(shù)據(jù)源用的還是一樣的,但是應(yīng)用模型不一樣,以后大家做排名可能就要分開(kāi)做了。
6、人氣模型:人氣模型原本計(jì)劃Q3全品類上線,目前還沒(méi)有做到,但也差不多覆蓋一半的類目了。人氣模型上線后和之前的商品質(zhì)量得分還是比較大的,主要體現(xiàn)在:
a、周期評(píng)論增加數(shù)替代總評(píng)論數(shù)計(jì)算權(quán)重
b、刪除提換貨率、跳失率和訪問(wèn)時(shí)間
c、新增緯度關(guān)注數(shù)、加入購(gòu)物車和訪問(wèn)深度
7、品牌模型:品牌模型已于618之前上線,這就是為什么有些類目,某些評(píng)論很少的產(chǎn)品可以排在最前面,就是品牌模型在起作用。品牌模型主要考核的一些點(diǎn)有:
a、擴(kuò)展區(qū)點(diǎn)擊量
b、搜索量
c、GMV
d、銷量
e、單價(jià)
8、店鋪模型:店鋪模型的主要作用是進(jìn)行資源平均,避免一個(gè)店鋪的產(chǎn)品扎堆顯示,造成消費(fèi)者的選擇疲勞,同一個(gè)店鋪的產(chǎn)品會(huì)被系統(tǒng)強(qiáng)制穿插,意思就是原則同一個(gè)店鋪有兩個(gè)產(chǎn)品可以排在第一和第二的,店鋪模型應(yīng)用后,只能是第一和第五。
9、個(gè)性化搜索:這個(gè)還在開(kāi)發(fā)。。。不知道什么時(shí)候上線,不過(guò)已經(jīng)應(yīng)用在一些推薦位了,例如感興趣,最佳組合等。
10、新品模型:顧名思義,新品有加權(quán)周期30天,搜索新品加權(quán)相同。
11、季節(jié)模型
太晚了,就到這了,后面再接著寫,關(guān)于最新反作弊這塊的。
評(píng)論列表