您可以尝试在Algolia爬虫程序中手动添加要获取的标签。这可以通过在爬虫配置文件中使用“extractSelector”选项来实现。例如,下面的示例代码将获取具有“google-codelabs-step”类的元素的所有文本内容:
algoliasearchHelper.Crawler(AlgoliaCrawlerConfiguration.createWithDefaults())
.setOnEveryCrawl((publicUrl, page, content) -> {
Document doc = Jsoup.parse(content);
Elements elements = doc.select(".google-codelabs-step");
List