fix: revert breaking changes in 32 and 44

kacperlukawski · kacperlukawski · commit c5ea845d1cbd · 2026-05-26T10:04:31.000+02:00
diff --git a/tutorials/32_Classifying_Documents_and_Queries_by_Language.ipynb b/tutorials/32_Classifying_Documents_and_Queries_by_Language.ipynb
@@ -10,7 +10,7 @@
     "\n",
     "- **Level**: Beginner\n",
     "- **Time to complete**: 15 minutes\n",
-    "- **Components Used**: [`InMemoryDocumentStore`](https://docs.haystack.deepset.ai/docs/inmemorydocumentstore), [`DocumentLanguageClassifier`](https://docs.haystack.deepset.ai/docs/documentlanguageclassifier), [`MetadataRouter`](https://docs.haystack.deepset.ai/docs/metadatarouter), [`DocumentWriter`](https://docs.haystack.deepset.ai/docs/documentwriter), [`TextLanguageRouter`](https://docs.haystack.deepset.ai/docs/textlanguagerouter), [`InMemoryBM25Retriever`](https://docs.haystack.deepset.ai/docs/inmemorybm25retriever), [`ChatPromptBuilder`](https://docs.haystack.deepset.ai/docs/chatpromptbuilder), [`OpenAIChatGenerator`](https://docs.haystack.deepset.ai/docs/openaichatgenerator)\n",
+    "- **Components Used**: [`InMemoryDocumentStore`](https://docs.haystack.deepset.ai/docs/inmemorydocumentstore), [`DocumentLanguageClassifier`](https://docs.haystack.deepset.ai/docs/documentlanguageclassifier), [`MetadataRouter`](https://docs.haystack.deepset.ai/docs/metadatarouter), [`DocumentWriter`](https://docs.haystack.deepset.ai/docs/documentwriter), [`TextLanguageRouter`](https://docs.haystack.deepset.ai/docs/textlanguagerouter), [`DocumentJoiner`](https://docs.haystack.deepset.ai/docs/documentjoiner), [`InMemoryBM25Retriever`](https://docs.haystack.deepset.ai/docs/inmemorybm25retriever), [`ChatPromptBuilder`](https://docs.haystack.deepset.ai/docs/chatpromptbuilder), [`OpenAIChatGenerator`](https://docs.haystack.deepset.ai/docs/openaichatgenerator)\n",
     "- **Goal**: After completing this tutorial, you'll have learned how to build a Haystack pipeline to classify documents based on the (human) language they were written in.\n",
     "- Optionally, at the end you'll also incorporate language clasification and query routing into a RAG pipeline, so you can query documents based on the language a question was written in."
    ]
@@ -385,6 +385,7 @@
    "outputs": [],
    "source": [
     "from haystack.components.retrievers.in_memory import InMemoryBM25Retriever\n",
+    "from haystack.components.joiners import DocumentJoiner\n",
     "from haystack.components.builders import ChatPromptBuilder\n",
     "from haystack.components.generators.chat import OpenAIChatGenerator\n",
     "from haystack.dataclasses import ChatMessage\n",
@@ -417,6 +418,7 @@
     "Create a new `Pipeline`. Add the following components:\n",
     "- `TextLanguageRouter`\n",
     "- `InMemoryBM25Retriever`. You'll need a retriever per language, since each language has its own `DocumentStore`.\n",
+    "- `DocumentJoiner`\n",
     "- `ChatPromptBuilder`\n",
     "- `OpenAIChatGenerator`\n",
     "\n",
@@ -439,15 +441,17 @@
        "  - en_retriever: InMemoryBM25Retriever\n",
        "  - fr_retriever: InMemoryBM25Retriever\n",
        "  - es_retriever: InMemoryBM25Retriever\n",
+       "  - joiner: DocumentJoiner\n",
        "  - prompt_builder: ChatPromptBuilder\n",
        "  - llm: OpenAIChatGenerator\n",
        "🛤️ Connections\n",
        "  - router.en -> en_retriever.query (str)\n",
        "  - router.fr -> fr_retriever.query (str)\n",
        "  - router.es -> es_retriever.query (str)\n",
-       "  - en_retriever.documents -> prompt_builder.documents (List[Document])\n",
-       "  - fr_retriever.documents -> prompt_builder.documents (List[Document])\n",
-       "  - es_retriever.documents -> prompt_builder.documents (List[Document])\n",
+       "  - en_retriever.documents -> joiner.documents (List[Document])\n",
+       "  - fr_retriever.documents -> joiner.documents (List[Document])\n",
+       "  - es_retriever.documents -> joiner.documents (List[Document])\n",
+       "  - joiner.documents -> prompt_builder.documents (List[Document])\n",
        "  - prompt_builder.prompt -> llm.messages (List[ChatMessage])"
       ]
      },
@@ -462,16 +466,18 @@
     "rag_pipeline.add_component(instance=InMemoryBM25Retriever(document_store=en_document_store), name=\"en_retriever\")\n",
     "rag_pipeline.add_component(instance=InMemoryBM25Retriever(document_store=fr_document_store), name=\"fr_retriever\")\n",
     "rag_pipeline.add_component(instance=InMemoryBM25Retriever(document_store=es_document_store), name=\"es_retriever\")\n",
+    "rag_pipeline.add_component(instance=DocumentJoiner(), name=\"joiner\")\n",
     "rag_pipeline.add_component(instance=ChatPromptBuilder(template=prompt_template), name=\"prompt_builder\")\n",
     "rag_pipeline.add_component(instance=OpenAIChatGenerator(), name=\"llm\")\n",
     "\n",
     "\n",
     "rag_pipeline.connect(\"router.en\", \"en_retriever.query\")\n",
     "rag_pipeline.connect(\"router.fr\", \"fr_retriever.query\")\n",
     "rag_pipeline.connect(\"router.es\", \"es_retriever.query\")\n",
-    "rag_pipeline.connect(\"en_retriever\", \"prompt_builder.documents\")\n",
-    "rag_pipeline.connect(\"fr_retriever\", \"prompt_builder.documents\")\n",
-    "rag_pipeline.connect(\"es_retriever\", \"prompt_builder.documents\")\n",
+    "rag_pipeline.connect(\"en_retriever\", \"joiner\")\n",
+    "rag_pipeline.connect(\"fr_retriever\", \"joiner\")\n",
+    "rag_pipeline.connect(\"es_retriever\", \"joiner\")\n",
+    "rag_pipeline.connect(\"joiner.documents\", \"prompt_builder.documents\")\n",
     "rag_pipeline.connect(\"prompt_builder.prompt\", \"llm.messages\")"
    ]
   },
diff --git a/tutorials/44_Creating_Custom_SuperComponents.ipynb b/tutorials/44_Creating_Custom_SuperComponents.ipynb
@@ -10,7 +10,7 @@
     "\n",
     "- **Level**: Intermediate\n",
     "- **Time to complete**: 20 minutes\n",
-    "- **Concepts and Components Used**: [`@super_component`](https://docs.haystack.deepset.ai/docs/supercomponents), [`Pipeline`](https://docs.haystack.deepset.ai/docs/pipelines), [`SentenceTransformersTextEmbedder`](https://docs.haystack.deepset.ai/docs/sentencetransformerstextembedder), [`InMemoryBM25Retriever`](https://docs.haystack.deepset.ai/docs/inmemorybm25retriever), [`InMemoryEmbeddingRetriever`](https://docs.haystack.deepset.ai/docs/inmemoryembeddingretriever), [`TransformersSimilarityRanker`](https://docs.haystack.deepset.ai/docs/transformerssimilarityranker)\n",
+    "- **Concepts and Components Used**: [`@super_component`](https://docs.haystack.deepset.ai/docs/supercomponents), [`Pipeline`](https://docs.haystack.deepset.ai/docs/pipelines), [`DocumentJoiner`](https://docs.haystack.deepset.ai/docs/documentjoiner), [`SentenceTransformersTextEmbedder`](https://docs.haystack.deepset.ai/docs/sentencetransformerstextembedder), [`InMemoryBM25Retriever`](https://docs.haystack.deepset.ai/docs/inmemorybm25retriever), [`InMemoryEmbeddingRetriever`](https://docs.haystack.deepset.ai/docs/inmemoryembeddingretriever), [`TransformersSimilarityRanker`](https://docs.haystack.deepset.ai/docs/transformerssimilarityranker)\n",
     "- **Goal**: After completing this tutorial, you'll have learned how to create custom SuperComponents using the `@super_component` decorator to simplify complex pipelines and make them reusable as components."
    ]
   },
@@ -103,6 +103,7 @@
    "outputs": [],
    "source": [
     "from haystack import Document, Pipeline, super_component\n",
+    "from haystack.components.joiners import DocumentJoiner\n",
     "from haystack.components.embedders import SentenceTransformersTextEmbedder\n",
     "from haystack.components.retrievers import InMemoryBM25Retriever, InMemoryEmbeddingRetriever\n",
     "from haystack.document_stores.in_memory import InMemoryDocumentStore\n",
@@ -117,15 +118,19 @@
     "        embedding_retriever = InMemoryEmbeddingRetriever(document_store)\n",
     "        bm25_retriever = InMemoryBM25Retriever(document_store)\n",
     "        text_embedder = SentenceTransformersTextEmbedder(embedder_model)\n",
+    "        document_joiner = DocumentJoiner(join_mode=\"reciprocal_rank_fusion\")\n",
     "\n",
     "        # Create the pipeline\n",
     "        self.pipeline = Pipeline()\n",
     "        self.pipeline.add_component(\"text_embedder\", text_embedder)\n",
     "        self.pipeline.add_component(\"embedding_retriever\", embedding_retriever)\n",
     "        self.pipeline.add_component(\"bm25_retriever\", bm25_retriever)\n",
+    "        self.pipeline.add_component(\"document_joiner\", document_joiner)\n",
     "\n",
     "        # Connect the components\n",
-    "        self.pipeline.connect(\"text_embedder\", \"embedding_retriever\")"
+    "        self.pipeline.connect(\"text_embedder\", \"embedding_retriever\")\n",
+    "        self.pipeline.connect(\"bm25_retriever\", \"document_joiner\")\n",
+    "        self.pipeline.connect(\"embedding_retriever\", \"document_joiner\")"
    ]
   },
   {
@@ -214,7 +219,8 @@
     "\n",
     "\n",
     "If we define an input mapping like `{\"query\": [\"text_embedder.text\", \"bm25_retriever.query\"]}`, we can call `retriever.run(query=query)`, and the query will automatically be routed to both the text embedder's `text` input and the BM25 retriever's `query` input.\n",
-    ""
+    "\n",
+    "You can also specify how the outputs should be exposed through `output_mapping`. For example, output mapping `{\"document_joiner.documents\": \"documents\"}` means that the documents produced by the `document_joiner` will be returned under the name `documents` when you call `retriever.run(...)`."
    ]
   },
   {
@@ -237,6 +243,7 @@
    "outputs": [],
    "source": [
     "from haystack import Document, Pipeline, super_component\n",
+    "from haystack.components.joiners import DocumentJoiner\n",
     "from haystack.components.embedders import SentenceTransformersTextEmbedder\n",
     "from haystack.components.rankers import TransformersSimilarityRanker\n",
     "from haystack.components.retrievers import InMemoryBM25Retriever, InMemoryEmbeddingRetriever\n",
@@ -257,17 +264,22 @@
     "        embedding_retriever = InMemoryEmbeddingRetriever(document_store)\n",
     "        bm25_retriever = InMemoryBM25Retriever(document_store)\n",
     "        text_embedder = SentenceTransformersTextEmbedder(embedder_model)\n",
+    "        document_joiner = DocumentJoiner()\n",
     "        ranker = TransformersSimilarityRanker(ranker_model)\n",
     "\n",
     "        # Create the pipeline\n",
     "        self.pipeline = Pipeline()\n",
     "        self.pipeline.add_component(\"text_embedder\", text_embedder)\n",
     "        self.pipeline.add_component(\"embedding_retriever\", embedding_retriever)\n",
     "        self.pipeline.add_component(\"bm25_retriever\", bm25_retriever)\n",
+    "        self.pipeline.add_component(\"document_joiner\", document_joiner)\n",
     "        self.pipeline.add_component(\"ranker\", ranker)\n",
     "\n",
     "        # Connect the components\n",
     "        self.pipeline.connect(\"text_embedder\", \"embedding_retriever\")\n",
+    "        self.pipeline.connect(\"bm25_retriever\", \"document_joiner\")\n",
+    "        self.pipeline.connect(\"embedding_retriever\", \"document_joiner\")\n",
+    "        self.pipeline.connect(\"document_joiner\", \"ranker\")\n",
     "\n",
     "        # Define input mapping\n",
     "        self.input_mapping = {\"query\": [\"text_embedder.text\", \"bm25_retriever.query\", \"ranker.query\"]}"
@@ -614,6 +626,7 @@
    "outputs": [],
    "source": [
     "from haystack import Document, Pipeline, super_component\n",
+    "from haystack.components.joiners import DocumentJoiner\n",
     "from haystack.components.embedders import SentenceTransformersTextEmbedder\n",
     "from haystack.components.retrievers import InMemoryBM25Retriever, InMemoryEmbeddingRetriever\n",
     "from haystack.components.rankers import TransformersSimilarityRanker\n",
@@ -632,17 +645,22 @@
     "        embedding_retriever = InMemoryEmbeddingRetriever(document_store)\n",
     "        bm25_retriever = InMemoryBM25Retriever(document_store)\n",
     "        text_embedder = SentenceTransformersTextEmbedder(embedder_model)\n",
+    "        document_joiner = DocumentJoiner()\n",
     "        ranker = TransformersSimilarityRanker(ranker_model)\n",
     "\n",
     "        # Create the pipeline\n",
     "        self.pipeline = Pipeline()\n",
     "        self.pipeline.add_component(\"text_embedder\", text_embedder)\n",
     "        self.pipeline.add_component(\"embedding_retriever\", embedding_retriever)\n",
     "        self.pipeline.add_component(\"bm25_retriever\", bm25_retriever)\n",
+    "        self.pipeline.add_component(\"document_joiner\", document_joiner)\n",
     "        self.pipeline.add_component(\"ranker\", ranker)\n",
     "\n",
     "        # Connect the components\n",
     "        self.pipeline.connect(\"text_embedder\", \"embedding_retriever\")\n",
+    "        self.pipeline.connect(\"bm25_retriever\", \"document_joiner\")\n",
+    "        self.pipeline.connect(\"embedding_retriever\", \"document_joiner\")\n",
+    "        self.pipeline.connect(\"document_joiner\", \"ranker\")\n",
     "\n",
     "        # Define input and output mappings\n",
     "        self.input_mapping = {\"query\": [\"text_embedder.text\", \"bm25_retriever.query\", \"ranker.query\"]}\n",
@@ -651,6 +669,7 @@
     "        self.output_mapping = {\n",
     "            \"bm25_retriever.documents\": \"bm25_documents\",\n",
     "            \"embedding_retriever.documents\": \"embedding_documents\",\n",
+    "            \"document_joiner.documents\": \"joined_documents\",\n",
     "            \"ranker.documents\": \"ranked_documents\",\n",
     "            \"text_embedder.embedding\": \"query_embedding\",\n",
     "        }"