新闻中心

使用Gson解析NDJSON文件中的多个JSON记录

2025-12-02
浏览次数:
返回列表

使用gson解析ndjson文件中的多个json记录

本文详细介绍了如何在J*a中利用Gson库解析NDJSON(换行符分隔的JSON)文件,以读取并映射文件中的所有独立JSON记录到对应的DTO对象列表中。针对一次性只能读取一个记录的问题,文章提出了基于JsonReader的循环读取策略,并强调了reader.peek()方法在判断文件末尾时的关键作用,同时提供了完整的示例代码和重要注意事项。

理解NDJSON格式与Gson的初始挑战

NDJSON(Newline Delimited JSON)是一种特殊的数据格式,其中每行都是一个独立的、有效的JSON对象,各行之间通过换行符分隔。与传统的JSON数组不同,NDJSON文件本身并非一个单一的JSON数组,而是多个JSON对象的集合。

当尝试使用Gson库解析NDJSON文件时,常见的初学者误区是直接调用gson.fromJson(reader, YourDTO.class)。例如,对于一个包含多条客户记录的customer.json文件:

// Record # 1
{
 "profile":{
      "salutation":"Mr",
      "title":null,
      "company":null
   },
   "phone":{
      "home_phone":null
   },
   "addresses":[
      {
         "address_id":"1",
         "first_name":"Veronica"
      }
   ],
   "orders":{
      "placed_orders_count":2
   }
}
// Record # 2
{
    "profile":{
      "salutation":null,
      "title":null
   },
   "phone":{
      "home_phone":null
   },
   "addresses":[
      {
         "address_id":"2",
         "title":""
      }
   ],
   "orders":{
      "placed_orders_count":0
   }
}
// ... 更多记录

如果使用以下代码尝试读取:

import com.google.gson.Gson;
import com.google.gson.stream.JsonReader;
import j*a.io.FileReader;
import j*a.io.IOException;

// 假设 CustomerFeedDTO 已经定义
// ...

public class InitialNdjsonReaderExample {
    public static void main(String[] args) {
        Gson gson = new Gson();
        try (JsonReader reader = new JsonReader(new FileReader("customer.json"))) {
            // 这种方式只能读取第一个JSON对象
            CustomerFeedDTO customerFeedDTO = gson.fromJson(reader, CustomerFeedDTO.class);
            System.out.println("成功读取第一个记录: " + customerFeedDTO);
            // 后续的记录将无法读取到,因为fromJson方法在读取完一个完整的JSON对象后就会停止。
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

这段代码只会成功解析文件中的第一个JSON对象,因为gson.fromJson()方法在读取完一个完整的JSON对象后就会停止。为了读取所有记录,我们需要一种机制来逐个处理文件中的每个JSON对象。

解决方案:循环读取与JsonReader

要正确解析NDJSON文件中的所有记录,核心思想是利用JsonReader的流式读取特性,通过循环逐个解析JSON对象。

aspx1财付通支付接口源码 aspx1财付通支付接口源码

本支付接口的特点,主要是用xml文件来记录订单详情和支付详情。代码比较简单,只要将里面的商户号、商户key换成你自己的,将回调url换成你的网站,就可以使用了。通过这个实例也可以很好的了解一般在线支付接口的基本工作原理。其中的pay.config文件记录的是支付详情,order.config是订单详情

aspx1财付通支付接口源码 0 查看详情 aspx1财付通支付接口源码

以下是实现这一目标的详细步骤和示例代码:

  1. 初始化JsonReader和Gson: 创建Gson实例和指向NDJSON文件的JsonReader。
  2. 设置宽松模式: 调用reader.setLenient(true)。这在处理一些非严格符合JSON规范的输入时非常有用,例如可能存在注释或未引用的字段名等。对于NDJSON文件,虽然通常是严格的,但开启此模式可以增加兼容性。
  3. 循环读取: 使用while (reader.peek() != JsonToken.END_DOCUMENT)作为循环条件。
    • reader.peek()方法用于查看下一个令牌的类型,而不会实际消耗它。
    • JsonToken.END_DOCUMENT表示已经到达JSON文档的末尾。通过检查这个令牌,我们可以确保在文件完全读取完毕后安全地退出循环。
  4. 解析并添加: 在循环内部,每次迭代都调用gson.fromJson(reader, CustomerFeedDTO.class)来解析当前行的JSON对象,并将其添加到预先创建的List中。
import com.google.gson.Gson;
import com.google.gson.stream.JsonReader;
import com.google.gson.stream.JsonToken; // 导入 JsonToken
import j*a.io.FileReader;
import j*a.io.IOException;
import j*a.util.ArrayList;
import j*a.util.List;
import j*a.util.Map;

// CustomerFeedDTO 类定义 (详见下一节)
class CustomerFeedDTO {
    private Map<String, ?> profile;
    private Map<String, ?> phone;
    private ArrayList<?> addresses;
    private Map<String, ?> orders;
    private ArrayList<?> customs;

    // Getters and setters (省略具体实现,但实际应用中需要)
    public Map<String, ?> getProfile() { return profile; }
    public void setProfile(Map<String, ?> profile) { this.profile = profile; }
    public Map<String, ?> getPhone() { return phone; }
    public void setPhone(Map<String, ?> phone) { this.phone = phone; }
    public ArrayList<?> getAddresses() { return addresses; }
    public void setAddresses(ArrayList<?> addresses) { this.addresses = addresses; }
    public Map<String, ?> getOrders() { return orders; }
    public void setOrders(Map<String, ?> orders) { this.orders = orders; }
    public ArrayList<?> getCustoms() { return customs; }
    public void setCustoms(ArrayList<?> customs) { this.customs = customs; }

    @Override
    public String toString() {
        return "CustomerFeedDTO{" +
               "profile=" + profile +
               ", phone=" + phone +
               ", addresses=" + addresses +
               ", orders=" + orders +
               ", customs=" + customs +
               '}';
    }
}

public class NdjsonMultiRecordReader {
    public static void main(String[] args) {
        List<CustomerFeedDTO> customerFeedDTOs = new ArrayList<>();
        Gson gson = new Gson();

        // 使用 try-with-resources 确保资源自动关闭
        try (JsonReader reader = new JsonReader(new FileReader("customer.json"))) {
            // 启用宽松模式,以处理可能存在的非严格JSON格式
            reader.setLenient(true);

            // 循环读取直到文档结束
            while (reader.peek() != JsonToken.END_DOCUMENT) {
                CustomerFeedDTO customerFeedDTO = gson.fromJson(reader, CustomerFeedDTO.class);
                customerFeedDTOs.add(customerFeedDTO);
                System.out.println("成功读取记录: " + customerFeedDTO); // 打印每条记录以验证
            }

            System.out.println("\n所有记录读取完毕。总计 " + customerFeedDTOs.size() + " 条记录。");

        } catch (IOException e) {
            System.err.println("读取文件时发生错误: " + e.getMessage());
            e.printStackTrace();
        }
    }
}

DTO类定义

为了成功映射NDJSON数据,需要一个对应的J*a数据传输对象(DTO)类。根据提供的NDJSON结构,一个示例的CustomerFeedDTO可以定义如下:

import j*a.util.ArrayList;
import j*a.util.Map;

public class CustomerFeedDTO {
    // 使用Map来灵活处理内部结构不固定的JSON对象
    private Map<String, ?> profile;
    private Map<String, ?> phone;
    // 使用ArrayList来处理JSON数组
    private ArrayList<?> addresses;
    private Map<String, ?> orders;
    private ArrayList<?> customs;

    // 构造函数 (可选)
    public CustomerFeedDTO() {}

    // Getters and Setters (必须提供,Gson通过反射调用它们进行数据绑定)
    public Map<String, ?> getProfile() {
        return profile;
    }

    public void setProfile(Map<String, ?> profile) {
        this.profile = profile;
    }

    public Map<String, ?> getPhone() {
        return phone;
    }

    public void setPhone(Map<String, ?> phone) {
        this.phone = phone;
    }

    public ArrayList<?> getAddresses() {
        return addresses;
    }

    public void setAddresses(ArrayList<?> addresses) {
        this.addresses = addresses;
    }

    public Map<String, ?> getOrders() {
        return orders;
    }

    public void setOrders(Map<String, ?> orders) {
        this.orders = orders;
    }

    public ArrayList<?> getCustoms() {
        return customs;
    }

    public void setCustoms(ArrayList<?> customs) {
        this.customs = customs;
    }

    @Override
    public String toString() {
        return "CustomerFeedDTO{" +
               "profile=" + profile +
               ", phone=" + phone +
               ", addresses=" + addresses +
               ", orders=" + orders +
               ", customs=" + customs +
               '}';
    }
}

注意: 实际应用中,Map 和 ArrayList> 可以被更具体的DTO类或泛型类型替换,以实现更强类型的数据访问和更清晰的代码结构。例如,profile可以是一个ProfileDTO对象,addresses可以是一个List,这样可以更好地封装数据并提供类型安全。

注意事项

  1. reader.setLenient(true)的重要性: 此方法允许JsonReader在解析JSON时更加宽容,例如接受未引用的名称、单引号字符串、C风格注释等。虽然NDJSON规范通常要求严格的JSON,但实际文件中可能存在一些不规范的格式。开启此模式可以提高解析的健壮性。

  2. reader.peek()与reader.hasNext()的比较:JsonReader确实有一个hasNext()方法,但它在到达文档末尾时可能会抛出IllegalStateException。相比之下,reader.peek() != JsonToken.END_DOCUMENT是一种更安全、更推荐的判断文件末尾的方式,它通过检查下一个令牌类型来避免异常。

  3. 资源管理:try-with-resources: 在处理文件I/O时,确保FileReader和JsonReader等资源被正确关闭至关重要,以防止资源泄露。J*a 7及更高版本提供的try-with-resources语句是管理这些可关闭资源的最佳实践,它能确保在try块结束时(无论正常结束还是异常结束)自动关闭资源。

  4. 异常处理: 文件读取和JSON解析过程中可能会出现IOException或JsonSyntaxException等异常。在生产代码中,应提供健壮的异常处理机制,例如记录错误日志、向用户提供友好的错误信息或采取恢复措施。

以上就是使用Gson解析NDJSON文件中的多个JSON记录的详细内容,更多请关注其它相关文章!


# 是一种  # 营销推广询火22星  # 晋宁区全渠道营销推广招聘  # 渭南工业全网营销推广  # 优质响应式网站建设  # 广州网站推广找哪家公司  # 编辑seo兼职  # 江北seo排名优化公司  # 商洛专业网站优化方案怎么写  # 山西省网站优化推广公司  # 金华网站推广厂家排名榜  # 自己的  # 实际应用  # 商户  # 文档  # java  # 就会  # 是一个  # 令牌  # 第一个  # 多个  # json数组  # 数据访问  # google  # stream  # ai  # go  # json  # js 


相关栏目: 【 科技资讯46185 】 【 网络学院92790


相关推荐: TikTok搜索不到用户发布内容怎么办 TikTok用户内容搜索优化方法  MAC怎么让Dock栏只显示当前运行的应用_MAC终端命令实现极简Dock栏  win11 arm版怎么安装 M1/M2 Mac虚拟机安装ARM win11的方法  构建轻量级网站内部消息系统:Formspree 集成指南  Win11文件资源管理器卡顿怎么修 Win11重置资源管理器进程优化响应速度【修复方法】  UC浏览器官网入口2025最新 UC浏览器网页版正式地址  2025AO3夸克浏览器通道_AO3手机HTTPS安全入口分享  AO3网页版最新入口合集 Archive of Our Own在线访问指南  小米Civi 4录制视频过暗_小米Civi 4亮度优化  ArrayList与LinkedList核心操作的Big-O复杂度分析  Golang如何使用const iota_Go iota常量计数器讲解  QQ邮箱登录首页官网地址2026 QQ邮箱官方网页入口  在J*a中如何开发在线活动报名与管理系统_活动报名管理项目实战解析  LINUX怎么设置定时任务_LINUX crontab配置教程  必由学官网首页入口 必由学教师网页版登录指南  Win11截图该按哪些键 Win11截屏完整流程解析【教程】  解决Tabulator日期时间排序问题的专业指南  Python实现多节点属性重叠度分析教程  在J*a项目里如何构建对象之间的契约_接口约束的实际落地  微信网页版官方快速登录入口 微信网页版网页版账号直达  C++ explicit关键字防止隐式转换_C++构造函数安全规范  Windows10怎么开启存储感知 Windows10系统设置自动清理临时文件释放C盘空间【教程】  如何高效处理PHP中的Excel数据导入导出?PortPHP/Spreadsheet助你轻松搞定!  微博网页版官方账号登录 微博网页版内容浏览使用指南  利用Bokeh CustomJS动态控制DataTable列可见性  探索高级语言到原生C/C++的转译:挑战与内存管理策略  “在文档元素之后找到了标记”是什么错误? 检查并修复XML中多个根元素的3个方法  Go语言中高效处理x-www-form-urlencoded表单数据  如何使用CaptainHook和Composer管理Git钩子_在提交前自动运行代码检查的Composer配置  Basecamp怎样用留言钉固定重点_Basecamp用留言钉固定重点【重点标记】  探索高级语言到C/C++的转译路径:以Go为例及内存管理策略  马斯克:Optimus 人形机器人复数形式为 Optimi  手机CPU怎么影响游戏体验_手机CPU对游戏性能的影响分析  UE5.7引擎表现爆炸优化无敌!5090跑4K稳定60FPS  Excel组合图表怎么做 Excel创建柱状图与折线组合图教程【图表】  HTML长属性值处理:表单action路径优化与代码规范应对  打开就能玩的植物大战僵尸 植物大战僵尸网页版传送门  Python vgamepad库按键模拟:正确使用XUSB_BUTTON常量  Win11怎么开启高性能模式_Windows 11电源计划优化设置  痛风发作了怎么办? 快速止痛和后期饮食调理  在Go Martini框架中高效服务动态生成图像的实践指南  c++ dfs和bfs代码 c++深度广度优先搜索算法  CSS图片焦点样式实现教程:理解与应用tabindex属性  印象笔记如何设离线包出差查阅_印象笔记设离线包出差查阅【离线阅读】  零跑汽车11月交付量达70327台 实现连续9个月正增长  C++如何比较两个字符串_C++ string compare函数与操作符对比  微博网页版直接访问 微博网页版账号管理快速入口  Lar*el 8 多关键词数据库搜索优化实践  文心一言怎样用批量生成做多版文案_文心一言用批量生成做多版文案【批量创作】  如何将HTML表格多行数据保存到Google Sheets 

搜索