97视频在线观看免费高清完整版在线观看-69精品人人人人-爱的色放3-亚洲黄色一区-亚洲精品视频免费在线观看-男人天堂免费视频-久久久社区-日韩综合一区二区-色撸撸在线-蝌蚪av-国产乱淫视频-男生尿隔着内裤呲出来视频-人操人操-欧美鲁鲁-免费视频99-3级av-中国一级大黄大黄大色毛片-久久久欧美精品-99精品在线看-色峰视频-印度毛茸茸-国产福利毛片-国产极品999-69日韩-天天综合网国产

星空人工智能技術(shù)網(wǎng)

ES Serverless 8.17王牌發(fā)布:向量檢索「火力全開」,智能擴(kuò)縮「秒級響應(yīng)」!

——原生ANN引擎,QPS飆升數(shù)十倍,成本新低,開發(fā)體驗「真香」!

開通入口>> https://www.aliyun.com/product/es/es-serverless

隨著生成式AI與實時數(shù)據(jù)分析需求激增,開發(fā)者亟需兼顧高性能、低成本且免運維的檢索服務(wù)。阿里云 Elasticsearch Serverless 基于官方8.17版本,深度融合無服務(wù)器架構(gòu)與分層擴(kuò)展能力,面向信息檢索、向量搜索、語義分析等通用場景,提供全托管服務(wù)。

一、Serverless服務(wù)簡介

阿里云 Elasticsearch Serverless 采用讀寫分離架構(gòu)與智能資源調(diào)度策略,自動監(jiān)控 CPU、內(nèi)存、網(wǎng)絡(luò)等關(guān)鍵指標(biāo),動態(tài)調(diào)整計算資源,消除手動擴(kuò)縮容與集群配置負(fù)擔(dān),是企業(yè)輕量化搭建搜索應(yīng)用的高性價比選擇。

與2024年7月發(fā)布的檢索通用型7.10版本相比,本次推出的檢索增強(qiáng)型8.17版本在最新特性擴(kuò)展、自動擴(kuò)縮性能、資源成本優(yōu)化三大維度實現(xiàn)全面躍升。本文將深度解析該版本通過工程優(yōu)化帶來的核心能力升級。

升級一:向量檢索性能飛躍

基于 Elasticsearch 8.17 版,發(fā)布最新向量能力,實現(xiàn)檢索性能、開發(fā)體驗的跨越式升級

·        高效 KNN 檢索:相較于7.10版依賴 script_score 自定義腳本進(jìn)行暴力檢索,8.17版原生支持高效的 KNN 檢索,查詢速度實現(xiàn)了質(zhì)的飛躍。

·        資源優(yōu)化:在高召回的同時,默認(rèn)int8量化能力將內(nèi)存占用降低75%,bbq 量化進(jìn)一步降低資源消耗。同等資源下,百萬級向量檢索 QPS 提升數(shù)十倍。

·        靈活組合查詢:8.17版原生支持 knn 向量查詢與傳統(tǒng) query 子句的靈活組合,并結(jié)合 RRF(Reciprocal Rank Fusion)實現(xiàn)多元召回結(jié)果的智能融合與統(tǒng)一排名,顯著提升復(fù)雜場景下的搜索相關(guān)性與用戶體驗。

升級二:智能化彈性調(diào)度架構(gòu)

全面升級智能化彈性調(diào)度架構(gòu),保障服務(wù)穩(wěn)定的同時1秒內(nèi)資源拓展到位,擴(kuò)縮更絲滑

ES Serverless 服務(wù)底層采用彈性架構(gòu),基于應(yīng)用 CU 等水位觀測,高效調(diào)度底層機(jī)器資源,實現(xiàn)低成本承接高用量的業(yè)務(wù)效果。相比檢索通用型(7.10版)應(yīng)用,檢索增強(qiáng)型(8.17版)不但大幅縮短了彈性響應(yīng)時效,同時放開了低峰期突增流量限流的限制。

真實案例對比:

·        A場景-流量逐漸穩(wěn)定增長:8.17版能夠瞬時響應(yīng)并正常承接增加的用戶請求量,幾乎沒有觸發(fā)限流;整體 RT 平穩(wěn)度和耗時更有優(yōu)勢,擴(kuò)容期間服務(wù)穩(wěn)定、性能有保障。

·        B場景-流量瞬時突增:8.17版能夠穩(wěn)定承接流量突增,而7.10版需要一定時間緩沖,初期成功率較低。8.17版在整體RT平穩(wěn)度、穩(wěn)定性與無感擴(kuò)容體驗上更優(yōu)。

如下圖,某真實電商網(wǎng)站在下午 18:00-21:00時間段開展品類大促活動,搜索流量能達(dá)到平時的3倍,并且會有突增 6 倍的秒殺活動,本文將模擬【A場景-流量逐漸穩(wěn)定增長】與【B場景-流量瞬時突增】兩種不同趨勢,對比分析檢索通用型(7.10版)應(yīng)用與檢索增強(qiáng)型(8.17版)應(yīng)用的體驗差異(下文簡稱為7.10應(yīng)用、8.17應(yīng)用)。

A-場景流量逐漸穩(wěn)定增長:三小時流量分別是一小時穩(wěn)定增流,一小時穩(wěn)定高峰,一小時穩(wěn)定減流。其中高峰為低峰的 3 倍流量。

深度解讀:

穩(wěn)定承接增加的用戶請求量

·        7.10 應(yīng)用受限于彈性機(jī)制的限制。在啟動增壓時,若增壓過程較快(如上),會出現(xiàn)因彈性反應(yīng)時間過長導(dǎo)致的限流;

·        8.17 應(yīng)用完成了瞬時響應(yīng),正常承接了增加的用戶請求量,沒有觸發(fā)限流。具體可見:失敗請求數(shù)統(tǒng)計圖表。

擴(kuò)容期間服務(wù)穩(wěn)定、性能有保障

·        8.17 應(yīng)用較 7.10 應(yīng)用在整體 RT 平穩(wěn)度、RT 耗時上都更有優(yōu)勢,可見流量增長過程中 8.17 的 RT/took 都很穩(wěn)定。具體可見:平均 RT 統(tǒng)計圖表。

·        8.17 應(yīng)用與 7.10 應(yīng)用均表現(xiàn)出優(yōu)秀的穩(wěn)定性體驗,8.17應(yīng)用擴(kuò)容更加無感、幾乎未出現(xiàn)重試操作。具體可見:成功率、重試率統(tǒng)計圖表。

 

嚴(yán)格貼合資源調(diào)度核算計量CU

·        在 CU 統(tǒng)計上,8.17 應(yīng)用更線性更穩(wěn)定;7.10 應(yīng)用在初期彈性和高峰期會有波動。具體可見:消耗CU、應(yīng)用請求 QPS、總請求數(shù)統(tǒng)計圖表。

 

B場景-流量瞬時突增:低峰期流量突增 6 倍場景

深度解讀:

穩(wěn)定承接增加的用戶請求量

·        8.17 應(yīng)用能夠穩(wěn)定承接流量突增;較「A-流量逐漸穩(wěn)定增長」, 該 case 更可見 7.10 應(yīng)用受限于彈性機(jī)制的限制需要一定的時間緩沖。在剛突增時,成功率維持在 42%左右,7 分鐘后恢復(fù)至 95%以上;下一區(qū)間的七分鐘后整體恢復(fù)。具體可見:消耗 CU、應(yīng)用請求 QPS、總請求數(shù)統(tǒng)計圖表。

Tips:使用8.17應(yīng)用時,需保證突增后的流量在 CU 上限以下,CU上限默認(rèn)取值為固定CU額度的3倍,可根據(jù)流量情況選擇合適的固定CU額度配置。7.10應(yīng)用在突增初期 QPS 更高是因為客戶端重試機(jī)制在限流時觸發(fā)了重試,在彈性完成后恢復(fù)正常。

擴(kuò)容期間服務(wù)穩(wěn)定、性能有保障

·        8.17 應(yīng)用較 7.10 應(yīng)用在整體 RT 平穩(wěn)度、RT 耗時上都更有優(yōu)勢,可見流量增長過程中 8.17 的 RT/took 都很穩(wěn)定。具體可見:平均 RT 統(tǒng)計圖表。

 

·        8.17 應(yīng)用較 7.10 應(yīng)用在穩(wěn)定性與無感擴(kuò)容體驗更優(yōu),始終保持更優(yōu)的成功率與重試率。具體可見:成功率、重試率統(tǒng)計圖表。

 

嚴(yán)格貼合資源調(diào)度核算計量CU

·        在 CU 統(tǒng)計上,8.17 應(yīng)用由于完成了秒級響應(yīng),貼合實際應(yīng)用請求 QPS 調(diào)度資源;7.10 應(yīng)用也根據(jù)實際調(diào)度情況統(tǒng)計出計量 CU,但在初期彈性和高峰期會有波動,8.17 應(yīng)用更線性更穩(wěn)定。具體可見:消耗 CU、應(yīng)用請求 QPS、總請求數(shù)統(tǒng)計圖表。

Tips:如果您已經(jīng)使用了7.10應(yīng)用,因版本或排期限制暫無計劃使用8.17應(yīng)用,針對周期性流量場景,您可通過工單形式提交分時彈性需求,為您的應(yīng)用開啟分時彈性功能后,將追平8.17應(yīng)用的彈性響應(yīng)效果。

最終對比結(jié)論:綜上所述,8.17 應(yīng)用彈性擴(kuò)容性能提升明顯,可做到無感升配,能有效承接突增、平穩(wěn)趨勢下的流量增長,提供流暢、穩(wěn)定的服務(wù)體驗。


升級三:資源成本優(yōu)化

通過預(yù)留+彈性 CU 模式靈活調(diào)度資源,CU 單價再調(diào)低,資源成本再優(yōu)化

為進(jìn)一步優(yōu)化資源成本,提升資源擴(kuò)縮體驗。檢索通用型8.17版采用了預(yù)留固定 CU 配額+按需使用的彈性 CU 用量收費的模式,預(yù)留固定 CU 的單價調(diào)整至更低。

綜上所述,阿里云 Elasticsearch Serverless 8.17 版在向量檢索性能、智能化彈性調(diào)度架構(gòu)及資源成本優(yōu)化方面實現(xiàn)了全面升級,為開發(fā)者提供了高性能、低成本且免運維的檢索服務(wù)解決方案。


二、使用指南


公測說明

檢索增強(qiáng)型應(yīng)用(8.17版)_檢索分析服務(wù) Elasticsearch版(ES)-阿里云幫助中心

檢索增強(qiáng)型應(yīng)用(8.17版)于2025年4月25日起已陸續(xù)在華東2(上海)、華北2(北京)、華南1(深圳)、華東1(杭州)地域開啟公測,在此期間,您無需申請即可免費試用。預(yù)計公測將于2025年6月16日結(jié)束,屆時,使用服務(wù)將按照相關(guān)計費項收取相應(yīng)費用。


三、開通檢索增強(qiáng)型應(yīng)用(8.17版)


步驟一、開通服務(wù)

第一次使用ES Serverless服務(wù)時,需要進(jìn)行服務(wù)開通。

1.      登錄Elasticsearch Serverless服務(wù)控制臺。

2.      在ES Serverless服務(wù)頁面,單擊立即開通。

3.      進(jìn)入服務(wù)開通頁面,選中服務(wù)協(xié)議,單擊立即開通。

步驟二、創(chuàng)建應(yīng)用

1.      進(jìn)入創(chuàng)建Serverless應(yīng)用的頁面,選擇創(chuàng)建實例的區(qū)域。

2.      單擊應(yīng)用管理。

3.      進(jìn)入應(yīng)用管理頁面,單擊創(chuàng)建應(yīng)用,配置應(yīng)用的基本信息。

(示例)本示例選擇應(yīng)用選型為檢索增強(qiáng)型(8.17版),其他參數(shù)保持默認(rèn)或自定義。

4.      配置應(yīng)用的訪問設(shè)置。

a. (示例)本示例選擇網(wǎng)絡(luò)訪問方式為公網(wǎng)訪問,在公網(wǎng)訪問白名單中添加本地設(shè)備的IP地址,以便使用本地設(shè)備訪問Serverless應(yīng)用的Kibana。

配置應(yīng)用公網(wǎng)訪問或私網(wǎng)訪問,請參見配置Serverless應(yīng)用公網(wǎng)或私網(wǎng)訪問。

b. 輸入用戶密碼,登錄時需要。

5.      單擊立即創(chuàng)建。

您可以在應(yīng)用管理頁面查看已創(chuàng)建的應(yīng)用列表。請等待應(yīng)用狀態(tài)變?yōu)檫\行中,這表示應(yīng)用已成功創(chuàng)建。隨后,您可以根據(jù)個人需求,嘗試體驗更多功能。

星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時溝通與處理。!:首頁 > 星空人工智能產(chǎn)業(yè) > VR|虛擬現(xiàn)實 » ES Serverless 8.17王牌發(fā)布:向量檢索「火力全開」,智能擴(kuò)縮「秒級響應(yīng)」!

感覺不錯,很贊哦! ()
分享到:

相關(guān)推薦

留言與評論(共有 0 條評論)
   
驗證碼: