AWS MSK S3 Sink Connector在没有模式注册表的情况下反序列化AVRO
创始人
2024-11-17 10:00:40
0

要在没有模式注册表的情况下反序列化AVRO,可以使用Confluent的Schema Registry客户端库进行手动解析和反序列化AVRO消息。下面是一个示例代码,演示了如何使用AWS MSK S3 Sink Connector将AVRO消息写入S3,并在不使用模式注册表的情况下进行反序列化:

import com.amazonaws.services.s3.AmazonS3;
import com.amazonaws.services.s3.AmazonS3ClientBuilder;
import com.amazonaws.services.s3.model.ObjectMetadata;
import io.confluent.kafka.serializers.AbstractKafkaAvroDeserializer;
import org.apache.avro.generic.GenericRecord;
import org.apache.commons.io.IOUtils;
import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.TopicPartition;
import org.apache.kafka.common.serialization.StringDeserializer;

import java.io.ByteArrayInputStream;
import java.io.InputStream;
import java.nio.charset.StandardCharsets;
import java.util.Collections;
import java.util.Properties;

public class AvroDeserializerWithoutRegistry {

    public static void main(String[] args) {
        String topic = "your-topic";
        String bootstrapServers = "your-bootstrap-servers";
        String s3Bucket = "your-s3-bucket";
        String s3KeyPrefix = "your-s3-key-prefix";

        Properties props = new Properties();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, bootstrapServers);
        props.put(ConsumerConfig.GROUP_ID_CONFIG, "avro-consumer");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);

        KafkaConsumer consumer = new KafkaConsumer<>(props);
        consumer.subscribe(Collections.singletonList(topic));

        AmazonS3 s3Client = AmazonS3ClientBuilder.defaultClient();

        while (true) {
            ConsumerRecords records = consumer.poll(100);
            for (ConsumerRecord record : records) {
                String key = record.key();
                String avroPayload = record.value();

                // Deserialize AVRO payload
                byte[] avroBytes = avroPayload.getBytes(StandardCharsets.ISO_8859_1);
                GenericRecord genericRecord = deserializeAvro(avroBytes);

                // Upload AVRO payload to S3
                String s3Key = s3KeyPrefix + key + ".avro";
                ObjectMetadata metadata = new ObjectMetadata();
                metadata.setContentLength(avroBytes.length);
                InputStream inputStream = new ByteArrayInputStream(avroBytes);
                s3Client.putObject(s3Bucket, s3Key, inputStream, metadata);
                IOUtils.closeQuietly(inputStream);
            }
            consumer.commitSync();
        }
    }

    private static GenericRecord deserializeAvro(byte[] avroBytes) {
        // Replace "your-schema" with your actual AVRO schema
        String schema = "your-schema";
        AbstractKafkaAvroDeserializer deserializer = new AbstractKafkaAvroDeserializer() {
            @Override
            protected Object deserialize(String topic, Boolean isKey, byte[] payload) {
                return null;
            }
        };
        deserializer.configure(Collections.singletonMap("schema.registry.url", ""), false);
        return (GenericRecord) deserializer.deserialize("", avroBytes, schema);
    }
}

请确保替换代码中的以下值:

  • your-topic:要消费的Kafka主题
  • your-bootstrap-servers:Kafka集群的引导服务器地址
  • your-s3-bucket:要将AVRO消息写入的S3存储桶
  • your-s3-key-prefix:用于AVRO消息在S3中的键前缀
  • your-schema:用于AVRO消息的实际模式

在上述代码中,我们使用了AbstractKafkaAvroDeserializer类来手动反序列化AVRO消息,替代了通常使用的模式注册表。然后,我们使用AWS SDK将AVRO消息上传到S3存储桶中。

请注意,由于没有使用模式注册表,我们需要手动提供AVRO模式。在示例代码中,将"your-schema"替换为您的AVRO模式。

相关内容

热门资讯

安卓换鸿蒙系统会卡吗,体验流畅... 最近手机圈可是热闹非凡呢!不少安卓用户都在议论纷纷,说鸿蒙系统要来啦!那么,安卓手机换上鸿蒙系统后,...
安卓系统拦截短信在哪,安卓系统... 你是不是也遇到了这种情况:手机里突然冒出了很多垃圾短信,烦不胜烦?别急,今天就来教你怎么在安卓系统里...
app安卓系统登录不了,解锁登... 最近是不是你也遇到了这样的烦恼:手机里那个心爱的APP,突然就登录不上了?别急,让我来帮你一步步排查...
安卓系统要维护多久,安卓系统维... 你有没有想过,你的安卓手机里那个陪伴你度过了无数日夜的安卓系统,它究竟要陪伴你多久呢?这个问题,估计...
安卓系统如何卸载app,轻松掌... 手机里的App越来越多,是不是感觉内存不够用了?别急,今天就来教你怎么轻松卸载安卓系统里的App,让...
windows官网系统多少钱 Windows官网系统价格一览:了解正版Windows的购买成本Windows 11官方价格解析微软...
怎么复制照片安卓系统,操作步骤... 亲爱的手机控们,是不是有时候想把自己的手机照片分享给朋友,或者备份到电脑上呢?别急,今天就来教你怎么...
安装了Anaconda之后找不... 在安装Anaconda后,如果找不到Jupyter Notebook,可以尝试以下解决方法:检查环境...
安卓系统应用怎么重装,安卓应用... 手机里的安卓应用突然罢工了,是不是让你头疼不已?别急,今天就来手把手教你如何重装安卓系统应用,让你的...
iwatch怎么连接安卓系统,... 你有没有想过,那款时尚又实用的iWatch,竟然只能和iPhone好上好?别急,今天就来给你揭秘,怎...