enable the device_map parameter in huggingface pipeline #12731

praveenv · 2023-11-01T19:40:22Z

Enabling `device_map` in HuggingFacePipeline

For multi-gpu settings with large models, the accelerate library provides the device_map parameter to automatically distribute the model across GPUs / disk.

The Transformers pipeline enables users to specify device (or) device_map, and handles cases (with warnings) when both are specified.

However, Langchain's HuggingFacePipeline only supports specifying device when calling transformers which limits large models and multi-gpu use-cases.
Additionally, the default value of device is initialized to -1 , which is incompatible with the transformers pipeline when device_map is specified.

This PR addresses the addition of device_map as a parameter , and solves the incompatibility of device = -1 when device_map is also specified.
An additional test has been added for this feature.

Additionally, some existing tests no longer work since

max_new_tokens has to be specified under pipeline_kwargs and not model_kwargs
The GPT2 tokenizer raises a ValueError: Pipeline with tokenizer without pad_token cannot do batching, since the tokenizer.pad_token is None (related issue on the transformers repo).

This PR handles fixing these tests as well.

vercel · 2023-11-01T19:40:26Z

The latest updates on your projects. Learn more about Vercel for Git ↗︎

1 Ignored Deployment

Name	Status	Preview	Comments	Updated (UTC)
langchain	⬜️ Ignored (Inspect)	Visit Preview		Nov 1, 2023 7:40pm

baskaryan · 2023-11-02T21:29:14Z

thanks @praveenv!

[![Mend Renovate](https://app.renovatebot.com/images/banner.svg)](https://renovatebot.com) This PR contains the following updates: | Package | Change | Age | Adoption | Passing | Confidence | |---|---|---|---|---|---| | [langchain](https://togithub.com/langchain-ai/langchain) | `==0.0.329` -> `==0.0.335` | [![age](https://developer.mend.io/api/mc/badges/age/pypi/langchain/0.0.335?slim=true)](https://docs.renovatebot.com/merge-confidence/) | [![adoption](https://developer.mend.io/api/mc/badges/adoption/pypi/langchain/0.0.335?slim=true)](https://docs.renovatebot.com/merge-confidence/) | [![passing](https://developer.mend.io/api/mc/badges/compatibility/pypi/langchain/0.0.329/0.0.335?slim=true)](https://docs.renovatebot.com/merge-confidence/) | [![confidence](https://developer.mend.io/api/mc/badges/confidence/pypi/langchain/0.0.329/0.0.335?slim=true)](https://docs.renovatebot.com/merge-confidence/) | --- ### Release Notes <details> <summary>langchain-ai/langchain (langchain)</summary> ### [`v0.0.335`](https://togithub.com/langchain-ai/langchain/releases/tag/v0.0.335) [Compare Source](https://togithub.com/langchain-ai/langchain/compare/v0.0.334...v0.0.335) #### What's Changed - vectara rag mq by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13214 - Add more runnable documentation by [@eyurtsev](https://togithub.com/eyurtsev) in [langchain-ai/langchain#13083 - Document RunnableWithFallbacks by [@eyurtsev](https://togithub.com/eyurtsev) in [langchain-ai/langchain#13088 - Add RunnableSequence documentation by [@eyurtsev](https://togithub.com/eyurtsev) in [langchain-ai/langchain#13094 - feat: FastEmbed embedding provider by [@Anush008](https://togithub.com/Anush008) in [langchain-ai/langchain#13109 - issue [#12165](https://togithub.com/langchain-ai/langchain/issues/12165) mask API key in chat_models/azureml_endpoint module by [@fyasla](https://togithub.com/fyasla) in [langchain-ai/langchain#12836 - Bagatur/langserve blurb by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13217 - Neo4j chat message history by [@tomasonjo](https://togithub.com/tomasonjo) in [langchain-ai/langchain#13008 - Add mongo parent template to index by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13222 - new course on `DeepLearning.ai` by [@leo-gan](https://togithub.com/leo-gan) in [langchain-ai/langchain#12755 - Update Documentation: Corrected Typos and Improved Clarity by [@fvaysh](https://togithub.com/fvaysh) in [langchain-ai/langchain#11725 - feat: Docusaurus Loader by [@leedotpang](https://togithub.com/leedotpang) in [langchain-ai/langchain#9138 - Fix Document Loader Unit Test - Docusaurus by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13228 - fleet_context docs update by [@adrwz](https://togithub.com/adrwz) in [langchain-ai/langchain#13221 - Add template for conversational rag with timescale vector by [@cevian](https://togithub.com/cevian) in [langchain-ai/langchain#13041 - Upgrade cohere embedding model to v3 by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13219 - update stack diagram by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13213 - Fix BeautifulSoupTransformer: no more duplicates and correct order of tags + tests by [@petervandenabeele](https://togithub.com/petervandenabeele) in [langchain-ai/langchain#12596 - Make it easier to subclass runnable binding with custom init args by [@nfcampos](https://togithub.com/nfcampos) in [langchain-ai/langchain#13189 - update tools by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#13243 - Update by [@hinthornw](https://togithub.com/hinthornw) in [langchain-ai/langchain#13208 - bump 335 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13261 #### New Contributors - [@Anush008](https://togithub.com/Anush008) made their first contribution in [langchain-ai/langchain#13109 **Full Changelog**: langchain-ai/langchain@v0.0.334...v0.0.335 ### [`v0.0.334`](https://togithub.com/langchain-ai/langchain/releases/tag/v0.0.334) [Compare Source](https://togithub.com/langchain-ai/langchain/compare/v0.0.333...v0.0.334) #### What's Changed - update oai cookbooks by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13135 - Multimodal rag traces by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13140 - Bagatur/docs smith context by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13139 - fix langsmith links by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13144 - Docs: combine LCEL index and why by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13142 - update modules sidebar by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13141 - update oai tool agent doc by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13147 - Pirate Speak Configurable Template by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13153 - OpenAI remove httpx typing by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13154 - Bagatur/docs serve context by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13150 - Fix langchain.llms OpenAI completion doesn't work due to v1 client update by [@dosuken123](https://togithub.com/dosuken123) in [langchain-ai/langchain#13099 - LCEL nits by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13155 - fix: Updates to formatting in Google Drive Retriever docs by [@holtskinner](https://togithub.com/holtskinner) in [langchain-ai/langchain#13015 - fix baiducloud_vector_search document typo by [@wemysschen](https://togithub.com/wemysschen) in [langchain-ai/langchain#12976 - fix module sidebar by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13158 - Clean up Fireworks provider documentation by [@zchenyu](https://togithub.com/zchenyu) in [langchain-ai/langchain#13157 - Document: Fix "Biadu" typo by [@Cweili](https://togithub.com/Cweili) in [langchain-ai/langchain#12985 - Add basic critique revise template by [@jacoblee93](https://togithub.com/jacoblee93) in [langchain-ai/langchain#12688 - Update model i/o by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13160 - improve duck duck go tool by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#13165 - Bagatur/update agent docs by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13167 - Add serve to quickstart by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13174 - template readme's in docs by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13152 - Update return type for Runnable.**or** by [@nfcampos](https://togithub.com/nfcampos) in [langchain-ai/langchain#12880 - Changes to root listener by [@nfcampos](https://togithub.com/nfcampos) in [langchain-ai/langchain#12174 - Update toolkit.py to remove single quotes around table names by [@The1Bill](https://togithub.com/The1Bill) in [langchain-ai/langchain#12445 - Add Chroma multimodal cookbook by [@rlancemartin](https://togithub.com/rlancemartin) in [langchain-ai/langchain#12952 - bump 334 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13211 #### New Contributors - [@Cweili](https://togithub.com/Cweili) made their first contribution in [langchain-ai/langchain#12985 - [@The1Bill](https://togithub.com/The1Bill) made their first contribution in [langchain-ai/langchain#12445 **Full Changelog**: langchain-ai/langchain@v0.0.333...v0.0.334 ### [`v0.0.333`](https://togithub.com/langchain-ai/langchain/releases/tag/v0.0.333) [Compare Source](https://togithub.com/langchain-ai/langchain/compare/v0.0.332...v0.0.333) #### What's Changed - update azure embedding docs by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13091 - update more azure docs by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13093 - Get project from langchain sdk by [@jakerachleff](https://togithub.com/jakerachleff) in [langchain-ai/langchain#13100 - Adds embeddings filter option to return scores in state by [@jacoblee93](https://togithub.com/jacoblee93) in [langchain-ai/langchain#12489 - Tool Retrieval Template by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13104 - feat: Vertex AI Search - Add Snippet Retrieval for Non-Advanced Website Data Stores by [@holtskinner](https://togithub.com/holtskinner) in [langchain-ai/langchain#13020 - (Astra DB/Cassandra) Minor clarification about dependencies in the demo notebook by [@hemidactylus](https://togithub.com/hemidactylus) in [langchain-ai/langchain#13118 - Bagatur/oai tool by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#13110 - Add message to documents by [@billytrend-cohere](https://togithub.com/billytrend-cohere) in [langchain-ai/langchain#12552 - bump 333 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13131 #### New Contributors - [@jakerachleff](https://togithub.com/jakerachleff) made their first contribution in [langchain-ai/langchain#13100 **Full Changelog**: langchain-ai/langchain@v0.0.332...v0.0.333 ### [`v0.0.332`](https://togithub.com/langchain-ai/langchain/releases/tag/v0.0.332) [Compare Source](https://togithub.com/langchain-ai/langchain/compare/v0.0.331...v0.0.332) #### What's Changed - Harrison/docs smith serve by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#12898 - fix langsmith link by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12939 - Add possibility to pass on_artifacts for a specific conversation by [@jakubno](https://togithub.com/jakubno) in [langchain-ai/langchain#12687 - Fix return metadata when searching for DingoDB by [@HeChangHaoGary](https://togithub.com/HeChangHaoGary) in [langchain-ai/langchain#12937 - Fix normalizing the cosine distance in Qdrant by [@kacperlukawski](https://togithub.com/kacperlukawski) in [langchain-ai/langchain#12934 - Fix typo in e2b_data_analysis.ipynb by [@cbpetersen](https://togithub.com/cbpetersen) in [langchain-ai/langchain#12930 - docs: update hf pipeline docs by [@praveenv](https://togithub.com/praveenv) in [langchain-ai/langchain#12908 - docs: clean up vestigial markdown by [@thezanke](https://togithub.com/thezanke) in [langchain-ai/langchain#12907 - fix baiducloud directory loader import file loader by [@wemysschen](https://togithub.com/wemysschen) in [langchain-ai/langchain#12924 - add baidu cloud vectorsearch document by [@wemysschen](https://togithub.com/wemysschen) in [langchain-ai/langchain#12928 - fix regex pattern of structured output parser by [@hmasdev](https://togithub.com/hmasdev) in [langchain-ai/langchain#12929 - Remove useless line of code from sql.ipynb by [@matthieudelaro](https://togithub.com/matthieudelaro) in [langchain-ai/langchain#12906 - fix guides link by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12941 - Fix for anyscale chat model api key by [@eyurtsev](https://togithub.com/eyurtsev) in [langchain-ai/langchain#12938 - feat: acquire advisory lock before creating extension in pgvector by [@VinzenzKlass](https://togithub.com/VinzenzKlass) in [langchain-ai/langchain#12935 - Add SecretStr for Symbl.ai Nebula API by [@praveenv](https://togithub.com/praveenv) in [langchain-ai/langchain#12896 - Add support of Cohere Embed v3 by [@kacperlukawski](https://togithub.com/kacperlukawski) in [langchain-ai/langchain#12940 - Bagatur/oai v1 scratch by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12948 - Record system fingerprint chat openai by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12960 - add oai v1 cookbook by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12961 - update schema by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#11320 - bump 331rc0 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12963 - fix max_tokens by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12964 - bump 331rc1 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12965 - oai v1 embeddings by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12969 - Vectara RAG template by [@ofermend](https://togithub.com/ofermend) in [langchain-ai/langchain#12975 - add ingest for mongo by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#12897 - Fix for rag-supabase readme by [@jasanfarah](https://togithub.com/jasanfarah) in [langchain-ai/langchain#12869 - bump 331rc2 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13006 - Multi modal RAG + QA Cookbooks by [@rlancemartin](https://togithub.com/rlancemartin) in [langchain-ai/langchain#12946 - Neo4j conversation cypher template by [@tomasonjo](https://togithub.com/tomasonjo) in [langchain-ai/langchain#12927 - cli pyproject updating by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12945 - Bagatur/oai assistant by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13010 - bump exp 38 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13016 - Add `Memorize` tool by [@Atry](https://togithub.com/Atry) in [langchain-ai/langchain#11722 - update stack diagram by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13021 - Add neo4j vector memory template by [@tomasonjo](https://togithub.com/tomasonjo) in [langchain-ai/langchain#12993 - Add "Astra DB" vector store integration by [@hemidactylus](https://togithub.com/hemidactylus) in [langchain-ai/langchain#12966 - Relock Templates by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13028 - Update Deps in Experimental by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13029 - template versions again by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13030 - Upgrade docs postcss by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13031 - redirect ls walkthrough by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13040 - Fleet context by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13038 - cli updates, 0.0.16 by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13034 - oai assistant multiple actions by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13068 - Add RunnableRetry Documentation by [@eyurtsev](https://togithub.com/eyurtsev) in [langchain-ai/langchain#13074 - Add Proper Import Error by [@Haste171](https://togithub.com/Haste171) in [langchain-ai/langchain#13042 - Azure OpenAI Embeddings by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#13039 - Don't pass EF to chroma by [@atroyn](https://togithub.com/atroyn) in [langchain-ai/langchain#13085 - bump 331rc3 exp 39 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13086 - bump 332 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#13089 #### New Contributors - [@cbpetersen](https://togithub.com/cbpetersen) made their first contribution in [langchain-ai/langchain#12930 - [@thezanke](https://togithub.com/thezanke) made their first contribution in [langchain-ai/langchain#12907 - [@hmasdev](https://togithub.com/hmasdev) made their first contribution in [langchain-ai/langchain#12929 - [@matthieudelaro](https://togithub.com/matthieudelaro) made their first contribution in [langchain-ai/langchain#12906 - [@VinzenzKlass](https://togithub.com/VinzenzKlass) made their first contribution in [langchain-ai/langchain#12935 - [@jasanfarah](https://togithub.com/jasanfarah) made their first contribution in [langchain-ai/langchain#12869 **Full Changelog**: langchain-ai/langchain@v0.0.331...v0.0.332 ### [`v0.0.331`](https://togithub.com/langchain-ai/langchain/releases/tag/v0.0.331) [Compare Source](https://togithub.com/langchain-ai/langchain/compare/v0.0.330...v0.0.331) #### What's Changed - coockbook: Fix typo in wikibase_agent.ipynb by [@standby24x7](https://togithub.com/standby24x7) in [langchain-ai/langchain#12839 - fix bes vector store search by [@wemysschen](https://togithub.com/wemysschen) in [langchain-ai/langchain#12828 - template: use dashes instead of underscores for neo4j-cypher package and path in readme by [@jexp](https://togithub.com/jexp) in [langchain-ai/langchain#12827 - mongo parent document retrieval by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#12887 - use keys not items by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#12918 - cli template gitignores by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12914 - Update csv.ipynb description by [@bhatt-priyadutt](https://togithub.com/bhatt-priyadutt) in [langchain-ai/langchain#12878 - bump 331 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12932 #### New Contributors - [@jexp](https://togithub.com/jexp) made their first contribution in [langchain-ai/langchain#12827 - [@bhatt-priyadutt](https://togithub.com/bhatt-priyadutt) made their first contribution in [langchain-ai/langchain#12878 **Full Changelog**: langchain-ai/langchain@v0.0.330...v0.0.331 ### [`v0.0.330`](https://togithub.com/langchain-ai/langchain/releases/tag/v0.0.330) [Compare Source](https://togithub.com/langchain-ai/langchain/compare/v0.0.329...v0.0.330) #### What's Changed - CLI 0.0.12 by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12787 - Fix on_llm_new_token(chunk=) for some chat models by [@nfcampos](https://togithub.com/nfcampos) in [langchain-ai/langchain#12784 - CLI 0.0.13, Configurable Template Demo by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12796 - Fix AddableDict raising exception when used with non-addable values by [@nfcampos](https://togithub.com/nfcampos) in [langchain-ai/langchain#12785 - Add input types to cypher templates by [@tomasonjo](https://togithub.com/tomasonjo) in [langchain-ai/langchain#12800 - Update llamacpp.ipynb by [@eltociear](https://togithub.com/eltociear) in [langchain-ai/langchain#12791 - Fixed broken link in Quickstart page by [@pythagoras-yamamoto](https://togithub.com/pythagoras-yamamoto) in [langchain-ai/langchain#12516 - Docs: 'memory' -> 'history' typo. by [@serranoarevalo](https://togithub.com/serranoarevalo) in [langchain-ai/langchain#12779 - Fix broken links to use cases by [@ab-10](https://togithub.com/ab-10) in [langchain-ai/langchain#12777 - Fixed a typo in templates/docs/CONTRIBUTING.md (delimeters =>delimiters) by [@ba230t](https://togithub.com/ba230t) in [langchain-ai/langchain#12774 - Use data from all Google search results in SerpApi.com wrapper by [@ilyazub](https://togithub.com/ilyazub) in [langchain-ai/langchain#12770 - zep: Update Zep docs and messaging by [@danielchalef](https://togithub.com/danielchalef) in [langchain-ai/langchain#12764 - **getattr** should rase AttributeError not ImportError on missing attributes by [@mbell697](https://togithub.com/mbell697) in [langchain-ai/langchain#12801 - enable the device_map parameter in huggingface pipeline by [@praveenv](https://togithub.com/praveenv) in [langchain-ai/langchain#12731 - Automatically add configurable key to config_schema if config_specs i… by [@nfcampos](https://togithub.com/nfcampos) in [langchain-ai/langchain#12798 - fix imports by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#12804 - add import tests to all modules by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12806 - Zep: Summary Search and Example by [@danielchalef](https://togithub.com/danielchalef) in [langchain-ai/langchain#12686 - zep: VectorStore: Use Native MMR by [@danielchalef](https://togithub.com/danielchalef) in [langchain-ai/langchain#12690 - feat: Supprt pgvecto.rs as a VectorStore by [@BeautyyuYanli](https://togithub.com/BeautyyuYanli) in [langchain-ai/langchain#12718 - Add TileDB vectorstore implementation by [@NikolaosPapailiou](https://togithub.com/NikolaosPapailiou) in [langchain-ai/langchain#12624 - Adds missing `urllib.parse` for IDE warning of `PubMedAPIWrapper` by [@jamesbraza](https://togithub.com/jamesbraza) in [langchain-ai/langchain#12808 - Correct number of elements in config list in `batch()` and `abatch()` of `BaseLLM` by [@akionux](https://togithub.com/akionux) in [langchain-ai/langchain#12713 - Bagatur/tiledb by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12811 - Add template for rag-singlestoredb by [@apeng-singlestore](https://togithub.com/apeng-singlestore) in [langchain-ai/langchain#12805 - Update template index by [@rlancemartin](https://togithub.com/rlancemartin) in [langchain-ai/langchain#12809 - migrate by [@mpskex](https://togithub.com/mpskex) in [langchain-ai/langchain#12810 - feat: add a rag template for momento vector index by [@malandis](https://togithub.com/malandis) in [langchain-ai/langchain#12757 - Keep also original query - multi_query.py by [@manuelrech](https://togithub.com/manuelrech) in [langchain-ai/langchain#12696 - updated `integrations/providers/google` by [@leo-gan](https://togithub.com/leo-gan) in [langchain-ai/langchain#12226 - Update quickstart.mdx by [@josephrmartinez](https://togithub.com/josephrmartinez) in [langchain-ai/langchain#12386 - Add Dataset Page to printout by [@hinthornw](https://togithub.com/hinthornw) in [langchain-ai/langchain#12816 - Autopopulate module name in cli init by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12814 - Disable trace_on_chain_group auto-tracing by [@hinthornw](https://togithub.com/hinthornw) in [langchain-ai/langchain#12807 - update mongo template by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#12838 - Remove admin prefix/suffix from docs for anthropic by [@bracesproul](https://togithub.com/bracesproul) in [langchain-ai/langchain#12849 - CLI 0.0.14, Uvicorn update and no more \[serve] by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12845 - Confirm sys.path includes current dir for app serve by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12851 - Update readmes with new cli install by [@efriis](https://togithub.com/efriis) in [langchain-ai/langchain#12847 - Template Readmes and Standardization by [@hwchase17](https://togithub.com/hwchase17) in [langchain-ai/langchain#12819 - Neo4j Advanced RAG template by [@tomasonjo](https://togithub.com/tomasonjo) in [langchain-ai/langchain#12794 - bump 330 by [@baskaryan](https://togithub.com/baskaryan) in [langchain-ai/langchain#12853 - Open Clip multimodal embeddings by [@rlancemartin](https://togithub.com/rlancemartin) in [langchain-ai/langchain#12754 - zep/rag conversation zep template by [@danielchalef](https://togithub.com/danielchalef) in [langchain-ai/langchain#12762 - Add template for self-query-qdrant by [@kacperlukawski](https://togithub.com/kacperlukawski) in [langchain-ai/langchain#12795 #### New Contributors - [@pythagoras-yamamoto](https://togithub.com/pythagoras-yamamoto) made their first contribution in [langchain-ai/langchain#12516 - [@ab-10](https://togithub.com/ab-10) made their first contribution in [langchain-ai/langchain#12777 - [@ba230t](https://togithub.com/ba230t) made their first contribution in [langchain-ai/langchain#12774 - [@ilyazub](https://togithub.com/ilyazub) made their first contribution in [langchain-ai/langchain#12770 - [@mbell697](https://togithub.com/mbell697) made their first contribution in [langchain-ai/langchain#12801 - [@praveenv](https://togithub.com/praveenv) made their first contribution in [langchain-ai/langchain#12731 - [@NikolaosPapailiou](https://togithub.com/NikolaosPapailiou) made their first contribution in [langchain-ai/langchain#12624 - [@apeng-singlestore](https://togithub.com/apeng-singlestore) made their first contribution in [langchain-ai/langchain#12805 - [@manuelrech](https://togithub.com/manuelrech) made their first contribution in [langchain-ai/langchain#12696 - [@josephrmartinez](https://togithub.com/josephrmartinez) made their first contribution in [langchain-ai/langchain#12386 - [@bracesproul](https://togithub.com/bracesproul) made their first contribution in [langchain-ai/langchain#12849 **Full Changelog**: langchain-ai/langchain@v0.0.329...v0.0.330 </details> --- ### Configuration 📅 **Schedule**: Branch creation - At any time (no schedule defined), Automerge - At any time (no schedule defined). 🚦 **Automerge**: Disabled by config. Please merge this manually once you are satisfied. ♻ **Rebasing**: Whenever PR is behind base branch, or you tick the rebase/retry checkbox. 🔕 **Ignore**: Close this PR and you won't be reminded about this update again. --- - [ ] If you want to rebase/retry this PR, check this box --- This PR has been generated by [Mend Renovate](https://www.mend.io/free-developer-tools/renovate/). View repository job log [here](https://developer.mend.io/github/GoogleCloudPlatform/database-query-extension).

…#12731) ### Enabling `device_map` in HuggingFacePipeline For multi-gpu settings with large models, the [accelerate](https://huggingface.co/docs/accelerate/usage_guides/big_modeling#using--accelerate) library provides the `device_map` parameter to automatically distribute the model across GPUs / disk. The [Transformers pipeline](https://github.com/huggingface/transformers/blob/3520e37e86913715959ff14fef76340010c8de57/src/transformers/pipelines/__init__.py#L543) enables users to specify `device` (or) `device_map`, and handles cases (with warnings) when both are specified. However, Langchain's HuggingFacePipeline only supports specifying `device` when calling transformers which limits large models and multi-gpu use-cases. Additionally, the [default value](https://github.com/praveenv/langchain/blob/8bd3ce59cd4ef80db5eb52922bb31588596939e1/libs/langchain/langchain/llms/huggingface_pipeline.py#L72) of `device` is initialized to `-1` , which is incompatible with the transformers pipeline when `device_map` is specified. This PR addresses the addition of `device_map` as a parameter , and solves the incompatibility of `device = -1` when `device_map` is also specified. An additional test has been added for this feature. Additionally, some existing tests no longer work since 1. `max_new_tokens` has to be specified under `pipeline_kwargs` and not `model_kwargs` 2. The GPT2 tokenizer raises a `ValueError: Pipeline with tokenizer without pad_token cannot do batching`, since the `tokenizer.pad_token` is `None` ([related issue](huggingface/transformers#19853) on the transformers repo). This PR handles fixing these tests as well. Co-authored-by: Praveen Venkateswaran <praveen.venkateswaran@ibm.com>

importTthis · 2023-12-22T05:39:25Z

Sorry to bother you，why do I use device_map but only use CPU for inference? I have two GPUs and have installed accelerate.
code:

from langchain.llms.huggingface_pipeline import HuggingFacePipeline


template = """Question: {question}

Answer: Let's think step by step."""
prompt = PromptTemplate.from_template(template)


gpus_llm = HuggingFacePipeline.from_model_id(
    model_id="/mnt/chinese-alpaca-7b/",
    task="text-generation",
    device_map="auto",  # replace with device_map="auto" to use the accelerate library.
    pipeline_kwargs={"max_new_tokens": 4000}
)

gpu_chain = prompt | gpus_llm

question = "What is electroencephalography?"

print(gpu_chain.invoke({"question": question}))

accelerate env:

- `Accelerate` version: 0.25.0
- Platform: Linux-5.4.0-153-generic-x86_64-with-glibc2.31
- Python version: 3.10.13
- Numpy version: 1.26.2
- PyTorch version (GPU?): 1.12.1 (True)
- PyTorch XPU available: False
- PyTorch NPU available: False
- System RAM: 94.30 GB
- GPU type: Quadro RTX 5000
- `Accelerate` default config:
   - compute_environment: LOCAL_MACHINE
   - distributed_type: MULTI_GPU
   - mixed_precision: fp16
   - use_cpu: False
   - debug: False
   - num_processes: 2
   - machine_rank: 0
   - num_machines: 1
   - rdzv_backend: static
   - same_network: False
   - main_training_function: main
   - downcast_bf16: False
   - tpu_use_cluster: False
   - tpu_use_sudo: False

enable the device_map parameter in huggingface pipeline

2f73b38

dosubot bot added Ɑ: models Related to LLMs or chat model modules 🤖:improvement Medium size change to existing code to handle new use-cases labels Nov 1, 2023

baskaryan approved these changes Nov 2, 2023

View reviewed changes

baskaryan merged commit 21eeba0 into langchain-ai:master Nov 2, 2023
21 checks passed

praveenv mentioned this pull request Nov 5, 2023

docs: update hf pipeline docs #12908

Merged

praveenv deleted the pipeline_device_map branch November 6, 2023 03:50

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

enable the device_map parameter in huggingface pipeline #12731

enable the device_map parameter in huggingface pipeline #12731

praveenv commented Nov 1, 2023 •

edited

Loading

vercel bot commented Nov 1, 2023 •

edited

Loading

baskaryan commented Nov 2, 2023

importTthis commented Dec 22, 2023 •

edited

Loading

enable the device_map parameter in huggingface pipeline #12731

enable the device_map parameter in huggingface pipeline #12731

Conversation

praveenv commented Nov 1, 2023 • edited Loading

Enabling device_map in HuggingFacePipeline

vercel bot commented Nov 1, 2023 • edited Loading

baskaryan commented Nov 2, 2023

importTthis commented Dec 22, 2023 • edited Loading

praveenv commented Nov 1, 2023 •

edited

Loading

Enabling `device_map` in HuggingFacePipeline

vercel bot commented Nov 1, 2023 •

edited

Loading

importTthis commented Dec 22, 2023 •

edited

Loading