Hacker News

Перастаньце спальваць сваё кантэкстнае акно - як мы скарацілі выхад MCP на 98% у Claude Code

Каментарыі

1 min read Via mksg.lu

Mewayz Team

Editorial Team

Hacker News

Схаваны падатак на кожны працоўны працэс на базе AI

Калі вы патрацілі шмат часу на стварэнне з дапамогай памочнікаў кадзіравання штучнага інтэлекту, вы наткнуліся на сцяну. Не той, калі мадэль галюцынуе або няправільна разумее ваш намер - больш тонкі, больш расчаравальны, калі ваш цалкам здольны AI партнёр раптам губляе сюжэт пасярод размовы. Ён забывае структуру файла, якую вы абмяркоўвалі тры паведамленні таму. Ён перачытвае ўжо прааналізаваныя файлы. Гэта пачынае супярэчыць яго ўласным ранейшым прапановам. Віной з'яўляецца не якасць мадэлі - гэта вычарпанне кантэкстнага акна, і адзіны найбуйнейшы ўклад - раздуты вывад інструмента, які ніхто не прасіў.

Гэтая праблема не з'яўляецца тэарэтычнай. Каманды, якія абапіраюцца на інтэграцыю MCP (пратакол кантэксту мадэлі) у Claude Code, Cursor і падобных асяроддзях распрацоўкі на базе штучнага інтэлекту, выяўляюць, што адказы іх інструментаў звычайна вяртаюць у 50-100 разоў больш даных, чым насамрэч патрэбна мадэлі. Просты запыт да базы дае поўныя дампы схемы. Пошук файлаў вяртае цэлыя дрэвы каталогаў. Праверка статусу API вяртае журналы з разбіўкай на старонкі тыднямі назад. Кожны лішні токен з'ядае канчатковае акно кантэксту, пагаршаючы прадукцыйнасць задач, якія сапраўды важныя. Выпраўленне нескладанае, але яно патрабуе фундаментальных зрухаў у тым, як вы думаеце аб распрацоўцы інструмента штучнага інтэлекту.

Чаму кантэкстныя Windows ламаюцца раней, чым мадэлі

Сучасныя вялікія моўныя мадэлі, такія як Claude, маюць шырокія кантэкстныя вокны — 200 тысяч маркераў у многіх канфігурацыях. Гэта гучыць велізарна, пакуль вы не зразумееце, як хутка гэта з'ядаюць працоўныя працэсы з вялікай колькасцю інструментаў. Адзін выклік інструмента MCP, які вяртае поўную табліцу базы дадзеных з 500 радкамі, можа спаліць 15 000-30 000 токенаў за адзін адказ. Злучыце пяць-шэсць з гэтых выклікаў у сеанс адладкі, і вы зрасходуеце палову кантэкстнага акна перад тым, як напісаць адзін радок кода. Мадэль не становіцца тупей - ёй літаральна не хапае месца, каб захаваць вашу размову ў памяці.

Эфект злучэння робіць гэта такім разбуральным. Калі кантэкст сціскаецца або скарачаецца, каб адпавядаць новай інфармацыі, мадэль губляе доступ да папярэдніх інструкцый, архітэктурных рашэнняў і ўсталяваных шаблонаў з вашай размовы. У канчатковым выніку вы паўтараеце сябе, аднаўляеце кантэкст і назіраеце, як штучны інтэлект робіць памылкі, якіх ён не зрабіў бы дзесяць паведамленняў раней. Для каманд інжынераў, якія пастаўляюць функцыі ў сціслыя тэрміны, гэта непасрэдна прыводзіць да страты гадзін і пагаршэння якасці кода.

У Mewayz мы сутыкнуліся менавіта з гэтай праблемай пры стварэнні нашай бізнес-платформы з 207 модуляў. Наш працоўны працэс распрацоўкі ў значнай ступені абапіраецца на кадзіраванне з дапамогай штучнага інтэлекту ва ўзаемазвязаных модулях — CRM, выстаўленне рахункаў, разлік заработнай платы, HR, аналітыка — дзе змены ў адным модулі часта пераходзяць у іншыя. Калі высновы нашых інструментаў MCP былі раздутымі, Клод губляў улік крос-модульных залежнасцей у межах адной сесіі. Рашэнне патрабавала ад нас пераасэнсавання кожнай рэакцыі інструмента з нуля.

Праграма скарачэння на 98%: чатыры прынцыпы, якія змянілі ўсё

Скарачэнне вываду MCP на 98% - гэта не выдаленне інфармацыі - гэта вяртанне толькі той інфармацыі, якая патрэбна мадэлі для прыняцця наступнага рашэння. Адрозненне мае значэнне. Інструменту, які вяртае запіс карыстальніка, не трэба ўключаць усе палі, калі мадэль пыталася толькі, ці існуе карыстальнік. Пошук файлаў не павінен вяртаць змесціва файла, калі мадэлі патрэбныя толькі шляхі да файлаў. Кожны адказ павінен адказваць на зададзенае пытанне, не больш за тое.

Вось чатыры прынцыпы, якія кіравалі нашай аптымізацыяй:

  1. Вярнуць зводкі, а не наборы даных. Замест вяртання 200 радкоў з запыту вярніце колькасць плюс 3-5 найбольш рэлевантных радкоў. Калі мадэлі патрабуецца больш, яна можа запытаць пэўны кавалачак. Гэта адзінае змяненне звычайна зніжае выдачу на 80-90% на інструментах з вялікай колькасцю даных.
  2. Выкарыстоўвайце структураваныя мінімальныя схемы. Выдаліце ўсе палі, якія не маюць непасрэднага дачынення да заяўленай мэты інструмента. Інструмент "праверкі стану разгортвання" павінен вяртаць статус, пазнаку часу і памылку (калі ёсць) — а не поўны маніфест разгортвання, зменныя асяроддзя і журналы зборкі.
  3. Укараненне прагрэсіўнага раскрыцця інфармацыі. Распрацуйце інструменты для вяртання зводкі высокага ўзроўню пры першым выкліку з параметрамі, якія дазваляюць глыбей дэталізаваць мадэль пры неабходнасці. Успрымайце гэта як пагінацыю для штучнага інтэлекту — спачатку дайце змест, а потым асобныя раздзелы па запыце.
  4. Агрэсіўная дэдуплікацыя. Калі мадэль ужо мае частку інфармацыі ў кантэксце (з папярэдняга выкліку інструмента або паведамлення карыстальніка), не вяртайце яе зноў. Адсочвайце тое, што было прадастаўлена, і спасылайцеся на гэта, а не паўтарайце.
Асноўнае разуменне: мэта адказу інструмента MCP - не паўната - гэта дастатковасць. Кожны токен, акрамя таго, што патрабуецца мадэлі для выканання наступнага дзеяння, з'яўляецца токенам, выкрадзеным з будучай здольнасці разважаць. Дызайн для рашэння мадэлі, а не для чалавечай цікаўнасці.

Практычная рэалізацыя: да і пасля

Каб зрабіць гэта канкрэтным, разгледзім агульны сцэнар развіцця: запыт структуры модуляў праекта, каб зразумець залежнасці. У нашай першапачатковай рэалізацыі інструмент MCP вяртаў поўны маніфест модуля — імя кожнага модуля, апісанне, версію, дрэва залежнасцей, параметры канфігурацыі і сцягі стану. Для 207-модульнай архітэктуры Mewayz гэты адзіны адказ зрасходаваў прыкладна 45 000 токенаў. Мадэлі спатрэбілася каля 800 токенаў гэтай інфармацыі, каб адказаць на пытанне "якія модулі залежаць ад модуля білінгу?"

Аптымізаваная версія вяртае плоскі спіс назваў модуляў з іх прамымі спасылкамі на залежнасці — без апісанняў, без канфігурацый, без нумароў версій. Калі мадэль вызначае адпаведныя модулі, яна можа выклікаць другі інструмент, каб атрымаць падрабязную інфармацыю аб пэўных модулях. Агульны кошт токенаў для таго ж пытання знізіўся з 45 000 да прыблізна 900 токенаў. Гэта зніжэнне на 98%, якое захоўвае здольнасць мадэлі разважаць пра поўную астатнюю размову.

Іншы прыклад: аналіз часопіса памылак. Арыгінальны інструмент вярнуў апошнія 500 запісаў журнала з поўнымі трасіроўкамі стэка, пазнакамі часу, метаданымі запыту і кантэкстам асяроддзя. Аптымізаваная версія вяртае зводку па частаце — «DatabaseConnectionError: 47 выпадкаў за апошнюю гадзіну, апошняе ў 14:32, якія закранаюць канечную кропку /api/invoices» — прыкладна ў 200 маркерах замест 12 000. Калі мадэлі патрэбна пэўная трасіроўка стэка, яна запытвае яе па ідэнтыфікатары памылкі. Такія ж магчымасці дыягностыкі, доля кошту.

Уплыў пульсацыі на хуткасць развіцця

Перавагі эканомных вынікаў MCP выходзяць далёка за рамкі простага размяшчэння ў кантэкстным акне. Калі мадэль захоўвае больш вашай гісторыі размоў, яна падтрымлівае ўзгодненасць у складаных шматфайлавых рэфактарах. Ён запамінае архітэктурныя абмежаванні, якія вы згадалі ў пачатку сеансу. Ён не прапаноўвае рашэнні, якія супярэчаць ужо прынятым вамі рашэнням. Якаснае паляпшэнне кадавання з дапамогай штучнага інтэлекту надзвычайнае — гэта розніца паміж здольным малодшым распрацоўшчыкам, які робіць нататкі, і тым, хто ўвесь час забывае, што вы ім сказалі.

Для нашай каманды, якая працуе над узаемазвязанымі бізнес-модулямі Mewayz, гэта азначала, што Клод можа паспяхова перамяшчацца па рэфактарах, якія закранаюць модулі CRM, выстаўлення рахункаў і аналітыкі, за адзін сеанс, не губляючы агульныя мадэлі даных, якія іх злучаюць. Да аптымізацыі гэтыя крос-модульныя задачы патрабавалі разбіць працу на ізаляваныя сесіі з працяглым паўторным інструктажом у пачатку кожнай. Пасля гэтага адзін бесперапынны сеанс можа апрацоўваць увесь працоўны працэс — гэта прыкладна ў 3 разы павялічвае прапускную здольнасць распрацоўшчыка пры складаных задачах.

Каманды, якія ствараюць любы шматкампанентны прадукт SaaS, распазнаюць гэты шаблон. Незалежна ад таго, кіруеце вы мікрасэрвісамі, модульным маналітам або платформай з дзесяткамі ўзаемазвязаных функцый, магчымасць падтрымліваць поўны кантэкст размовы падчас навігацыі па складаных кодавых базах з'яўляецца пераўтваральнай. Аптымізацыя - гэта не проста налада прадукцыйнасці - яна змяняе тое, што магчыма за адзін сеанс распрацоўкі з дапамогай штучнага інтэлекту.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Тыповыя памылкі, якія сабатуюць ваш кантэкстны бюджэт

Нават каманды, якія разумеюць прынцып мінімальнага выхаду, часта робяць памылкі пры рэалізацыі, якія падрываюць іх намаганні. Часцей за ўсё апісанні інструментаў MCP разглядаюцца як дакументацыя, а не як аператыўнае праектаванне. Апісанне інструмента з'яўляецца асноўным кіраўніцтвам мадэлі аб тым, як выкарыстоўваць інструмент і чаго чакаць ад яго вынікаў. Расплывістыя апісанні, такія як "вяртае інфармацыю аб праекце", прыводзяць да таго, што мадэль робіць шырокія даследчыя званкі. Дакладныя апісанні, такія як "вяртае спіс назваў модуляў, якія непасрэдна залежаць ад вызначанага модуля", накіроўваюць мадэль на выкананне мэтанакіраваных эфектыўных запытаў.

Яшчэ адной частай памылкай з'яўляецца неадрозненне інструментаў чытання і аналізу. Інструмент, які чытае файл, павінен вяртаць змесціва файла. Інструмент, які аналізуе файл, павінен вяртаць вынікі аналізу, а не змесціва файла плюс аналіз. Калі гэтыя абавязкі размываюцца, вы атрымліваеце інструменты, якія вяртаюць неапрацаваныя даныя разам з апрацаванай інфармацыяй, падвойваючы кошт токена без карысці для разважанняў мадэлі.

Трэці падводны камень - непаслядоўнае фарматаванне адказу. Калі некаторыя інструменты вяртаюць JSON, іншыя вяртаюць табліцы ўцэнкі, а трэція вяртаюць звычайны тэкст, мадэль марнуе токены на аналіз і нармалізацыю розных фарматаў. Стандартызуйце адзіны кампактны фармат — як правіла, мінімальны JSON з паслядоўнымі назвамі палёў — і ваша мадэль будзе марнаваць менш токенаў на разуменне фармату і больш на фактычнае рашэнне праблем.

Стварэнне кантэкстна-арыентаванай экасістэмы інструмента

Самы складаны падыход да аптымізацыі вываду MCP выходзіць за рамкі асобных рэакцый інструмента і разглядае ўсю экасістэму інструмента як скаардынаваную сістэму. Гэта азначае інструменты, якія ведаюць пра тое, што іншыя інструменты ўжо вярнулі ў бягучым сеансе, інструменты, якія могуць спасылацца на папярэднія вынікі па ідэнтыфікатары замест іх паўторнага выбару, і інструменты, якія адаптуюць сваю шматслоўнасць на аснове пакінутага кантэкстнага бюджэту.

Укараненне інструментаў з улікам сеансу патрабуе лёгкага ўзроўню прамежкавага праграмнага забеспячэння, які адсочвае гісторыю выклікаў інструментаў у размове. Пры выкліку інструмента прамежкавае праграмнае забеспячэнне правярае, ці існуюць ужо адпаведныя даныя ў кантэксце, і адпаведным чынам карэктуе адказ. Напрыклад, калі мадэль ужо атрымала спіс актыўных модуляў, наступны выклік інструмента пра залежнасці модуляў можа спасылацца на модулі па імені без іх паўторнага апісання. Такая інфармаванасць паміж інструментамі можа паменшыць сукупнае выкарыстанне токенаў яшчэ на 30-40% за межамі аптымізацыі асобных інструментаў.

Для каманд інжынераў, якія ацэньваюць гэты падыход, інвестыцыі акупляюцца прапарцыйна складанасці вашай экасістэмы інструментаў. Праект з трыма інструментамі MCP можа не апраўдаць накладныя выдаткі на прамежкавае праграмнае забеспячэнне. Такая платформа, як Mewayz, з інструментамі, якія ахопліваюць запыты да базы дадзеных, кіраванне модулямі, стан разгортвання, аналіз памылак і сувязь паміж сэрвісамі, бачыць складаную аддачу ад кожнага ўзроўню аптымізацыі. Прынцып маштабуецца: чым больш інструментаў у вас ёсць, тым большую каштоўнасць вы атрымліваеце ад таго, каб зрабіць іх кантэкстна-свядомымі.

Шырокі ўрок для распрацоўкі AI-First

Праблема аптымізацыі кантэкстнага вокна паказвае нешта важнае аб бягучым стане распрацоўкі з дапамогай штучнага інтэлекту: мы ўсё яшчэ толькі пачынаем вучыцца распрацоўваць сістэмы для выкарыстання штучнага інтэлекту. Большасць інструментаў MCP ствараюцца распрацоўшчыкамі, якія думаюць аб вывадзе інструмента так, як яны думаюць пра адказы API - усёабдымныя, добра задакументаваныя і поўныя. Але мадэль штучнага інтэлекту - гэта не інтэрфейснае прыкладанне, якое адлюстроўвае прыборную панэль. Гэта механізм разумення з канечным бюджэтам памяці, і кожны байт гэтага бюджэту непасрэдна ўплывае на якасць вываду.

Каманды, якія будуць ствараць найлепшыя працоўныя працэсы распрацоўкі на аснове штучнага інтэлекту ў бліжэйшыя некалькі гадоў, будуць не толькі з лепшымі мадэлямі або найбольшай колькасцю інструментаў. Яны будуць тымі, хто разглядае кіраванне кантэкстнымі вокнамі як першакласную інжынерную дысцыпліну — хто вымярае бюджэт токенаў гэтак жа, як яны вымяраюць затрымку API, хто аптымізуе адказы інструментаў так, як яны аптымізуюць запыты да базы дадзеных, і хто разумее, што пры распрацоўцы з дапамогай штучнага інтэлекту меншая колькасць добра дастаўленай інфармацыі стабільна пераўзыходзіць большую колькасць інфармацыі, дастаўленай неасцярожна.

Незалежна ад таго, ствараеце вы стартап з адным прадуктам або кіруеце складанай платформай з сотнямі ўзаемазвязаных модуляў, прынцып той самы: паважайце кантэкстнае акно. Вашы інструменты штучнага інтэлекту настолькі добрыя, наколькі добрае месца вы ім даяце для разважанняў.

Часта задаюць пытанні

Што такое вычарпанне кантэкстнага акна і чаму гэта важна?

Знясіленне кантэкстнага акна адбываецца, калі ў памочніка па кадаванні AI заканчваецца карысная памяць падчас размовы з-за раздутых вывадаў інструмента. Гэта прымушае мадэль забываць ранейшы кантэкст, перачытваць файлы без неабходнасці і супярэчыць уласным прапановам. Для каманд, якія спадзяюцца на працоўныя працэсы распрацоўкі на базе штучнага інтэлекту, гэта незаўважна пагаршае прадукцыйнасць і якасць вываду, ператвараючы здольнага памочніка ў ненадзейнага без відавочнага паведамлення пра памылку.

Як вам удалося паменшыць выхад MCP на 98%?

Мы рэструктурызавалі адказы нашага інструмента MCP, каб вяртаць толькі неабходныя даныя замест падрабязных, нефільтраваных вынікаў. Укараніўшы разумнае абагульненне, выбарачны вяртанне палёў і кантэкстна-залежнае адсячэнне, мы ліквідавалі шум, які паглынаў каштоўныя токены кантэксту. У выніку Claude Code падтрымлівае паслядоўныя, прадуктыўныя размовы на працягу значна больш працяглых сеансаў - дазваляючы складаныя, шматэтапныя інжынерныя задачы без страты ніткі.

Ці працуе гэтая аптымізацыя з такімі платформамі, як Mewayz?

Абавязкова. Mewayz - гэта 207-модульная бізнес-АС ад 19 долараў у месяц, якая абапіраецца на эфектыўную аўтаматызацыю штучнага інтэлекту на ўсёй платформе. Аптымізаваныя вынікі MCP азначаюць, што працоўныя працэсы з дапамогай штучнага інтэлекту ў такіх інструментах, як Mewayz на app.mewayz.com, працуюць хутчэй і больш надзейна, паколькі кожны захаваны токен ператвараецца непасрэдна ў больш працяглыя прадуктыўныя сеансы і больш дакладныя адказы пры кіраванні складанымі бізнес-аперацыямі.

Ці магу я прымяніць гэтыя метады аптымізацыі MCP да маіх уласных праектаў?

Так. Асноўныя прынцыпы — мінімізацыя карыснай нагрузкі адказу, вяртанне толькі запытаных палёў і абагульненне вялікіх набораў даных перад перадачай іх у мадэль — універсальна прыдатныя. Незалежна ад таго, ствараеце вы карыстальніцкія серверы MCP або інтэгруеце інструменты іншых вытворцаў з Claude Code, аўдыт выхадных дадзеных вашага інструмента на наяўнасць непатрэбнай шматслоўнасці - гэта адзіная аптымізацыя з самым высокім уздзеяннем, якую вы можаце зрабіць, каб павялічыць працягласць прадуктыўнай размовы.

.

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime